Rusia hace hablar a máquinas con acento propio

Rusia hace hablar a máquinas con acento propio


Herman Gref —banquero, exministro y, según el manual del realismo ruso, un tipo que toma café mientras arde el cielo— revisa balances en el piso 32 de Sberbank. El gigante atiende a más de 140 millones de clientes y ahora quiere pensar solo, sin mandar sus datos en cohetes rumbo a California. Afuera, las cúpulas del Kremlin devuelven una luz que parece hacer sumas en silencio: independencia tecnológica, sí o sí, aunque se partan los nudillos.

UNO. Los rusos recuerdan que, antes de los modismos y las apps, hubo pizarrones donde Kolmogórov dibujó el esqueleto de la probabilidad, ese arte de adivinar con método. Después vino la fuga tras la caída de la Unión Soviética: decenas de miles de cerebros se fueron por la puerta que se abre con dólares y se cerró con teclados viejos. No se escribió novela alguna, pero se oxidó la maquinaria y quedó la pregunta de país grande con computadora chica.

El siglo XXI les explicó rápido que el poder no solo se mide en tanques, también en pala-bras que entienden y obedecen. Y Sber encaró la travesía con billetera y terquedad: montó centros de datos, equipos de ingenieros y una supercomputadora con más de 700 GPUs A100, una bestia llamada Christofari Neo que mastica casi 12 petaflops, lo bastante como para soplar la pelusa de bibliotecas enteras y seguir con ganas. Dicho en criollo, es una fábrica de neuronas de silicio capaz de entrenar modelos de lenguaje grandes, día y noche, sin pedir disculpas.

DOS. De ese horno salió GigaChat, bautizado con ironía de meme —GigaChad— y hambre de idioma. No promete milagros en matemáticas altas; promete algo más íntimo: entender matices rusos que a los modelos anglófonos se les escapan como peces por la red. Las nuevas versiones pisan fuerte y, según los propios ránkings del ecosistema, trepan al primer lugar cuando el examen se rinde en cirílico, no en Oxford. El chiste es serio: cuando la conversación es propia, la máquina contesta mejor.

La cosa no se queda en poesía, ya que más de 15 mil empresas lo enchufaron al mostrador para vender, atender y decidir, mientras Sber lo ofrece tanto en la nube como dentro de casa. Como quien elige si cocina en la vereda o en la cocina de la abuela. La corbata queda a un lado y hablan los resultados con menos esperas, más aciertos y una fila que avanza, porque el sistema se entrena con novelas, formularios y rezongos del mostrador.

Alexander Vedyakhin —número 2 del banco— no vende humo: admite un rezago de medio año largo contra estadounidenses y chinos, una distancia que no se tapa con banderas sino con estrategia. El remedio suena a peronismo tecnológico: fabricar chips propios, cuidar los datos puertas adentro y abrazarse con Pekín lo justo para ganar tiempo sin entregar la billetera. El resto son discursos para la televisión.

La agencia espacial rusa, siempre amiga de los gestos, se propone subir GigaChat a la Estación Espacial Internacional para ayudar a procesar imágenes en un ámbito donde no hay margen para chamuyos. Si funciona ahí, funciona en la ventanilla de cualquier ministerio don-de un formulario da vueltas como calesita. Y mientras tanto, en el Café Pushkin en la Avenida Tverskaya, la gente le pregunta recetas, impuestos o libros; un millón de consultas pequeñas que enseñan a hablar mejor que cualquier seminario.

TRES. Política exterior, traducción simultánea: Putin y Xi firman papeles que prometen no “politizar la ciencia”, pero debajo corre la tinta verdadera: compartir datos, arquitecturas, músculo de entrenamiento y una apuesta en común por idiomas que no piden permiso a la gramática de Londres. Soberanía no es gritar; es exportar menos dependencia e importar menos problemas.

Gref, con sanciones a cuestas desde 2022, sigue de frente: sistema operativo propio, ser-vidores propios, procesadores propios. Un tejido nacional que piensa en voz baja pero firme: si me cortan la luz de afuera, adentro igual hay vela. En algún punto, Pushkin sonríe: la lengua también es un territorio, y defenderlo no es chauvinismo, es sentido común.

¿Y qué pasa en Argentina e Iberoamérica? El talón de Aquiles está a la vista: leyes de protección de datos flojas, blandas como pan del día anterior, muy lejos del blindaje europeo. Mientras allá los gigantes asiáticos y norteamericanos deben ajustarse para entrar en caja, acá aterrizan sin despeinarse. Y para peor, casi no hay políticas serias de soberanía digital. Resultado: gobiernos que entregan la llave del sótano y dejan los servidores en manos de terceros. Por caso, cuentas de oficiales de policías en la ciudad se manejan en Gmail, algo que sería inadmisible en otras latitudes.

La factura de esa ingenuidad se paga caro. Porque cuando truena la geopolítica —caso de Ucrania desde 2022— el que no controla su información se queda sin defensa ni continuidad de sus sistemas críticos.

Por eso, en distintos foros se discute que es la hora de que cada administración agarre el timón. Datos que duerman en casa, candado propio, contratos sin letra chica y auditorías que prendan la luz donde nadie quiere mirar. Un marco legal de verdad, sin ventanas abiertas. Después, sí: alianzas, pero de cooperación, no de sumisión. La nube no salva si el enchufe es de otro: o se escribe la propia arquitectura digital de un país o se mendiga la contraseña. Y en ese reparto, el que presta la clave puede terminar cambiándola.

Calculadoras que susurran en cirílico: Rusia hace hablar a máquinas con acento propio
Uno y otro

GigaChat (Rusia): Tamaño del modelo: 20.000 millones de parámetros. Cantidad de texto (límite): Hasta 32.000 palabras. Qué hace: chat, imágenes, voz, video y música. Aptitud en matemáticas: puntuación baja en pruebas de cálculo. Idiomas: ruso e inglés, mejor en ruso.

GPT-4 o OpenAI: Tamaño del modelo: 1 800.000 millones de parámetros. Cantidad de texto (límite): hasta 128.000 palabras. Qué hace: chat, imágenes y voz. Aptitud en matemáticas: mejor puntuación en pruebas de cálculo. Idiomas: más de 50.

Gemini Ultra (Google): Tamaño del modelo: no publicado. Cantidad de texto (límite): hasta 1.000.000 palabras. Qué hace: chat, imágenes, voz y video. Aptitud en matemáticas: no disponible. Idiomas: Muchas lenguas.

Claude 3 Opus (Anthropic): Tamaño del modelo: No publicado. Cantidad de texto (límite): Hasta 200.000 palabras. Qué hace: chat e imágenes. Aptitud en matemáticas: bueno en pruebas de comprensión general. Idiomas: varias lenguas, fluido en todas.

Fuente: GigaChat, OpenAI, Gemini y Anthropic.



Leave a Reply

Your email address will not be published. Required fields are marked *