한국   대만   중국   일본 
Analisis de frecuencias - Wikipedia, la enciclopedia libre Ir al contenido

Analisis de frecuencias

De Wikipedia, la enciclopedia libre
Frecuencia de las letras en un texto ingles.
Frecuencia de las letras en un texto espanol.

En el criptoanalisis , la tecnica de analisis de frecuencias consiste en el aprovechamiento de estudios sobre la frecuencia de las letras o grupos de letras en los idiomas para poder establecer hipotesis para aprovecharlas para poder descifrar un texto cifrado sin tener la clave de descifrado (romper). Es un metodo tipico para romper cifrados clasicos .

El analisis de frecuencias esta basado en el hecho de que, dado un texto, ciertas letras o combinaciones de letras aparecen mas a menudo que otras, existiendo distintas frecuencias para ellas. Es mas, existe una distribucion caracteristica de las letras que es practicamente la misma para la mayoria de ejemplos de ese lenguaje. Por ejemplo, en ingles la letra E es muy comun, mientras que la X es muy rara. Igualmente, las combinaciones ST, NG, TH y QU son pares de letras comunes, mientras que NZ y QJ son raros. La frase mnemotecnica " ETAOIN SHRDLU " agrupa las doce letras mas frecuentes en los textos ingleses. En espanol , las vocales son muy frecuentes, ocupando alrededor del 45 % del texto, siendo la E y la A las que aparecen en mas ocasiones, mientras que la frecuencia sumada de F, Z, J, X, K y W no alcanza el 2 %. La regla mnemotecnica para el espanol seria "EAOSR NIDLC" o bien "EAOSN RILDUT".

En algunos cifradores, las propiedades naturales del texto plano se preservan en el texto cifrado . Dichos esquemas pueden ser potencialmente objeto de ataques de solo texto cifrado.

Analisis de frecuencia para algoritmos de sustitucion simple [ editar ]

En un algoritmo de sustitucion simple , cada letra del texto plano sera transformada siempre por una unica letra en el mensaje cifrado. Por ejemplo, todas las e se convertiran en X . Un texto cifrado con una alta frecuencia de letras X podria sugerir al criptoanalista que la X representa a la letra e .

El uso basico del analisis de frecuencias consiste en primero calcular la frecuencia de las letras que aparecen en el texto cifrado y luego asociar letras de texto plano a ellas. Una gran frecuencia de X podria sugerir que las X son e , pero esto no es siempre cierto, ya que las letras a y o tienen una frecuencia muy alta tambien en espanol. Sin embargo, si sera dificil que las X representen, en este caso a la k o a la w . Por ello, el criptoanalista podria tener que intentar varias combinaciones hasta descifrar el texto.

Estadisticas mas complejas podrian ser usadas, como considerar los pares de letras o incluso trios, con el fin de proporcionar mas informacion al criptoanalista; e incluso tecnicas mas elaboradas con el fin de mejorar su eficacia (Triana & Ruiz, 2015). Por ejemplo, las letras q y u van casi siempre juntas en espanol, mientras que la q sola es muy rara.

Uso en la Historia [ editar ]

Primera pagina de Un manuscrito para el descifrado de mensajes criptograficos , de Al-Kindi .

La primera explicacion bien documentada del analisis de frecuencias (de hecho de cualquier tipo de criptoanalisis) fue dada en el siglo  IX por el filosofo arabe Al-Kindi en Un manuscrito para el descifrado de mensajes criptograficos (Ibraham, 1992). Su uso se extendio y fue tan usado en Europa durante el Renacimiento que se inventaron pautas para tratar de burlar el estudio de las frecuencias. Estas incluian:

  • El uso de alternativas para las letras mas comunes. Asi, por ejemplo, las letras X e Y encontradas en el texto cifrado podrian significar E en el texto plano.
  • Cifrado polialfabetico , esto es, el uso de varios alfabetos para el cifrado. Leone Alberti parece ser el primero en sugerir esto.
  • Sustitucion poligrafica , esquemas donde pares o trios de letras eran cifradas como una unica unidad. Por ejemplo, el cifrado de Playfair , inventado por Charles Wheatstone a mediados del siglo  XIX .

Una desventaja de todos estos intentos de derrotar el analisis de frecuencias es que complicaban tanto el cifrado como el descifrado de los datos, provocando errores.

Las maquinas de rotores de la primera mitad del siglo  XX (por ejemplo, Enigma ) eran esencialmente inmunes al analisis de frecuencias directo, aunque otros tipos de analisis consiguieron decodificar los mensajes de tales aparatos.

El analisis de frecuencias solo requiere un conocimiento basico de las estadisticas del texto plano y cierta pericia resolviendo problemas. Durante la Segunda Guerra Mundial , tanto los britanicos como los estadounidenses reclutaron rompecodigos colocando puzles y crucigramas en los periodicos y realizando concursos para ver quien los resolvia mas rapidamente. Muchos de los cifrados usados por el Eje eran vulnerables al analisis de frecuencias (por ejemplo, algunos de los mensajes cifrados usados por los consulados japoneses ). Los metodos mecanicos del conteo de letras y el analisis de las estadisticas (generalmente maquinas de tarjetas perforadas de IBM ) fueron usadas durante la II Guerra Mundial, siendo probablemente los miembros del SIS estadounidense los pioneros. Hoy en dia, el trabajo de contar letras y analizar frecuencias ha sido dejado a programas informaticos , que pueden realizar esas cuentas en segundos. Con la potencia computacional actual, los metodos de cifrado clasico proveen poca proteccion real para la privacidad de los mensajes.

Bibliografia [ editar ]