Qué es High-Flyer, el fondo chino que impulsa DeepSeek y lleva años utilizando la IA para tomar decisiones de inversión
DeepSeek es la compañía de inteligencia artificial (IA) de moda. Sus modelos de lenguaje más recientes han desafiado el liderazgo de OpenAI y han provocado un auténtico terremoto en la industria tecnológica. Estos días hemos sabido que se fundó en mayo de 2023 y que ha desarrollado sus productos con una fracción de la capacidad de cómputo de algunos de sus principales rivales occidentales. Pero ¿qué más se sabe? Vamos a verlo.
El prometedor presente de DeepSeek es el resultado de años de investigación que comenzaron mucho antes de su constitución oficial. Su origen se encuentra en High-Flyer, un fondo cuantitativo de inversión creado en 2015 por el estudiante de ingeniería electrónica Liang Wenfeng junto a dos compañeros de clase. Según cuentan en su página web, la idea era que los algoritmos se convirtieran en el corazón de su negocio al permitir operaciones en tiempo real.
Una compañía enfocada en el mercado bursátil chino
High-Flyer concretó su primera posición bursátil asistida por IA en octubre de 2016, movimiento que desencadenó un imparable esfuerzo para seguir trabajando en ese sentido. La compañía conformó equipos de investigación y desarrollo de software y hardware. Y aparentemente fue la decisión adecuada. En 2017 ya aplicaba IA en casi todas sus estrategias de inversión cuantitativas, pero para seguir avanzando necesitaba romper algunas barreras.
Descubrieron que las tareas de entrenamiento de modelos complejos requerían de una potencia de cálculo descomunal. Esto no les desanimó y en 2019 pusieron en marcha una división dedicada llamada High-Flyer AI para abordar el desafío. El grupo construyó empezó a trabajar con 500 GPU, después construyó un supercomputador de 1.100 GPU A100 de NVIDIA y en 2022 gastó 140 millones de dólares para elevar el número hasta 10.000 GPU, antes de la entrada en vigor de los controles de exportación de Estados Unidos.
High-Flyer estaba completamente enfocada en desarrollar su negocio de trading algorítmico. Tenía su propia plataforma de entrenamiento de aprendizaje profundo y una destacada infraestructura de cómputo. Mientras tanto, en Estados Unidos había una empresa llamada OpenAI que apostaba por la IA generativa y que había sorprendido a muchos con las bondades de su modelo de lenguaje GPT-3.
Como recoge China Talk, Liang quería ir más allá de las finanzas. Durante mucho tiempo había estado convencido de que la IA cambiaría el mundo, y había encontrado la oportunidad de llevar su esfuerzo al siguiente nivel. En 2023, High-Flyer anunció que sentaría las bases de una nueva organización para avanzar en el desarrollo de la inteligencia artificial general (AGI). Así nació DeepSeek, con una inyección de capital de High-Flyer.
DeepSeek es producto de años de trabajo de High-Flyer y evidentemente ha bebido mucho de esta compañía. Ambas firmas comparten oficinas en el mismo edificio, aunque parece que utilizan recursos de cómputo diferente. La startup de IA dice que cuenta con chips H20, que se venden como rosquillas en China, y H800 de NVIDIA, y que ha utilizado solo 2.048 GPU de este último modelo para entrenar sus modelos más recientes, una afirmación que algunos han cuestionado.
Imágenes | High-Flyer | DeepSeek