Inteligencia Artificial
Películas generadas por IA llegarán antes de lo que imaginamos
La nueva herramienta de Google DeepMind lo demuestra
Los generadores de video de IA como Sora de OpenAI , Dream Machine de Luma AI y Runway Gen-3 Alpha se han estado destacando últimamente, pero una nueva herramienta de Google DeepMind podría solucionar la única debilidad que todos comparten: la falta de audio de acompañamiento.
Tecnología V2A de Google DeepMind
Una nueva publicación de Google DeepMind ha revelado una nueva herramienta de conversión de vídeo a audio (o «V2A») que utiliza una combinación de píxeles e indicaciones de texto para generar automáticamente bandas sonoras y paisajes sonoros para vídeos generados por IA. En resumen, es otro gran paso hacia la creación de escenas cinematográficas totalmente automatizadas.
Como puedes ver en los videos a continuación, esta tecnología V2A puede combinarse con generadores de video de IA para crear una banda sonora atmosférica, efectos de sonido o incluso un diálogo que, según Google DeepMind, «coincide con los personajes y el tono de un video».
Los creadores tampoco están limitados a una única opción de audio: la nueva herramienta V2A de DeepMind aparentemente puede generar una «cantidad ilimitada de bandas sonoras para cualquier entrada de video» para cualquier escena, lo que significa que puede acercarla al resultado deseado con unas pocas indicaciones de texto simples.
Usos indebidos y deepfakes
Google afirma que su herramienta se distingue de la tecnología de sus rivales gracias a su capacidad de generar audio basándose únicamente en píxeles (aparentemente, darle una guía en texto es opcional). Pero DeepMind también es muy consciente del gran potencial de usos indebidos y deepfakes, por lo que esta herramienta V2A se ha reservado como proyecto de investigación, por ahora.
DeepMind afirma que «antes de considerar abrir el acceso a la tecnología al público en general, nuestra tecnología V2A se someterá a rigurosas evaluaciones y pruebas de seguridad». Sin duda, será necesario que sean rigurosas, porque los ejemplos breves en vídeo muestran que la tecnología tiene un potencial explosivo, tanto para bien como para mal.
Aplicaciones y Futuro
El potencial para la producción cinematográfica y la animación amateur es enorme, como lo demuestra el siguiente clip de una escena al estilo de Blade Runner (abajo), que muestra autos derrapando por una ciudad. Esto podría reducir drásticamente los presupuestos para películas de ciencia ficción.
La tecnología V2A de DeepMind solo mejorará drásticamente a partir de ahora.
La combinación de videos generados por IA con bandas sonoras y efectos de sonido creados por IA es un cambio radical en muchos niveles y agrega otra dimensión a una carrera armamentista que ya estaba al rojo vivo.
OpenAI ya ha dicho que tiene planes de añadir audio a su generador de vídeo Sora, que se lanzará a finales de este año. Pero la nueva herramienta V2A de DeepMind demuestra que la tecnología ya está en una fase avanzada y puede crear audio basándose únicamente en vídeos, en lugar de necesitar indicaciones interminables.
La herramienta de DeepMind funciona con un modelo de difusión que combina información extraída de los píxeles del vídeo y las indicaciones de texto del usuario, y luego genera un audio comprimido que luego se decodifica en una forma de onda de audio. Al parecer, se entrenó con una combinación de vídeo, audio y anotaciones generadas por IA.
Tecnología V2A de Google DeepMind ya está adelantado a los demás
No está claro exactamente con qué contenido se entrenó esta herramienta V2A, pero Google claramente tiene una ventaja potencialmente enorme al poseer la plataforma de intercambio de videos más grande del mundo, YouTube . Ni YouTube ni sus términos de servicio son completamente claros sobre cómo se podrían usar sus videos para entrenar a la IA, pero el CEO de YouTube, Neal Mohan, dijo recientemente a Bloomberg que algunos creadores tienen contratos que permiten que su contenido se use para entrenar modelos de IA.
Es evidente que la tecnología aún tiene algunas limitaciones en lo que respecta a los diálogos y aún falta mucho para producir un artículo terminado que esté listo para Hollywood. Pero ya es una herramienta potencialmente poderosa para el guion gráfico y para los cineastas aficionados, y la competencia feroz con empresas como OpenAI significa que solo va a mejorar rápidamente.
Recursos adicionales:
Sora de OpenAI: https://openai.com/index/sora/
Dream Machine de Luma AI: https://luma-ai.com/
Runway Gen-3 Alpha: https://runwayml.com/
Google DeepMind: https://deepmind.google/
Inteligencia Artificial
IA Generativa para mejorar cómo trabajan las PYMEs
Se puede decir mucho sobre los pros y los contras de la IA generativa. Pero, si bien todos podemos estar de acuerdo en que está ampliamente disponible, seguramente también podemos estar de acuerdo en que no es la primera tecnología emergente que está disponible y es disruptiva (ni será la última).
Comenzando desde cero con la IA Generativa
Para empezar a comprender las posibilidades de la IA generativa y el ecosistema tecnológico de IA en general, lo mejor es empezar desde cero. Cuando buscamos la definición de tecnología, vemos que es “la aplicación del conocimiento científico con fines prácticos”. Con la IA generativa, vemos que se comparte mucho conocimiento científico. Sin embargo, no creo que muchos hayan comprendido completamente cómo puede ser verdaderamente práctica y útil en todas las industrias que la están explorando hoy.
El potencial de la IA Generativa en las pequeñas empresas
Como ejemplo, veamos el mayor caballo de batalla de las economías del mundo: los propietarios de pequeñas empresas. Si bien muchos emprendedores trabajan incansablemente en sus operaciones diarias, muchos también esperan encontrar formas de usar la IA para aumentar la productividad . Y si bien hoy brinda algunos beneficios inmediatos, como crear rápidamente materiales de marketing básicos o acelerar las respuestas a algunas consultas de servicio al cliente, hay mucho más potencial. Pero acceder a gran parte de ese potencial requiere más tiempo, recursos y experiencia.
Te podría interesar:
Qué es la IA. Qué pasará a futuro en una 4ta o 5ta generación
La Inteligencia Artificial se define como la capacidad de las máquinas para simular procesos cognitivos humanos
¿Quién puede solucionar esto?
La responsabilidad debería recaer en los proveedores de servicios del ecosistema de las pequeñas empresas que están creando las plataformas y aplicaciones que utilizan los propietarios de las empresas . Esto se aplica a las empresas especializadas, pero también a las plataformas y gigantes de la tecnología de consumo. Todos tenemos un papel que desempeñar en el proceso de configuración: desarrollar el conocimiento científico de algo como la IA generativa para su aplicación específica en los casos de uso de las pequeñas empresas, asegurándonos de que moldeamos la «materia prima» de la tecnología en algo que sea directamente útil para ellas. Esto significa que debe haber una línea de comunicación abierta en todo momento entre nosotros en el ámbito tecnológico y nuestros clientes de pequeñas empresas para asegurarnos de que nos centramos en ayudar con las tareas que más les importan.
Preparándose para el futuro con la IA Generativa
La pregunta sigue siendo: ¿significa esta nueva tecnología que el trabajo tal como lo conocemos nunca será el mismo? ¿O la IA reemplazará los empleos en las pequeñas empresas o en toda la economía? Solo tenemos que mirar las tecnologías “revolucionarias” del pasado, como los correos electrónicos, las hojas de cálculo o los teléfonos inteligentes, para ver que lo primero puede ser cierto, pero lo segundo es menos probable. En lugar de cambiar empleos enteros, las tareas que los componen evolucionarán y se modificarán.
La IA generativa no tiene como objetivo reemplazar al contable, por ejemplo, sino más bien brindar más capacidad a la profesión contable para que se concentre en responsabilidades de asesoramiento de mayor valor. Además, la confianza ganada con tanto esfuerzo que los contables han construido con sus clientes no desaparecerá por sí sola y no puede ser reemplazada fácilmente por un algoritmo, sin importar cuán inteligente sea. Porque, cuando hay mucho en juego y están en juego los medios de vida financieros, usted quiere tener a alguien que sea un socio a su lado. Alguien a quien pueda pedirle cuentas por sus consejos y orientación. Y, después de todo, ¿quién es más responsable que su contable?
Inteligencia Artificial
El Ejército de EE.UU. utilizará más IA en sus operaciones
El Ejército de Estados Unidos quiere incorporar algoritmos de IA (inteligencia artificial) del sector privado en sus operaciones diarias para mejorar la eficiencia y la productividad, pero no en combate.
Necesidad de Procesamiento de Datos
El Ejército de EE. UU. dice que tiene enormes cantidades de datos para procesar y la IA puede ayudar a manejar estas extensas reservas de datos en segundos.
Intervención en la Cumbre de AWS
En la reciente cumbre de AWS en Washington DC, Young Bang, subsecretario adjunto principal del Ejército para adquisiciones, logística y tecnología, destacó la eficiencia de adoptar herramientas de IA existentes en lugar de crear otras nuevas desde cero.
Entusiasmo por el Potencial de la IA
El Ejército de EE. UU. está muy entusiasmado con el potencial de la tecnología para procesar datos. Entre las seis ramas de las fuerzas armadas de Estados Unidos, el Ejército es el que utiliza con mayor frecuencia inteligencia artificial y algoritmos, gracias a su entorno rico en datos.
Desafíos y Consideraciones de Seguridad
A pesar de los beneficios claros de la IA, la transición no está exenta de desafíos. Es necesario considerar cuidadosamente las cuestiones de seguridad, incluidos los sesgos, las alucinaciones y la posibilidad de vulneración de datos.
Solicitud de Información al Sector Privado
El Ejército planea emitir una solicitud de información al sector privado para obtener soluciones, en lugar de abordar los riesgos internamente. Bang resumió ante la audiencia de AWS: “Este es el Ejército diciendo que necesitamos su ayuda”.
Próximos Pasos
Aunque los detalles específicos sobre el cronograma de solicitud de información aún no están claros, un portavoz confirmó a Washington Technology que se recibirán una serie de solicitudes en los próximos meses.
Colaboración con el Sector Privado
Si bien el Ejército de Estados Unidos tiene un don para hacer “ciertas cosas realmente bien”, Bang sugirió que el sector privado es el mejor preparado para ayudar en este escenario.
Evaluación y Respuesta a los Obstáculos
A medida que continúa el trabajo para automatizar algunos de los procesos del Ejército de EE.UU., la fuerza armada sigue evaluando y respondiendo a los obstáculos de adopción en preparación para el día en que la IA comercial se active en el Ejército de EE. UU.
Información adicional: https://www.washingtontechnology.com/contracts/2024/07/army-plans-multiple-ai-industry-partnerships/397791/
Inteligencia Artificial
Fábricas de IA: Centros de datos que crean inteligencia artificial
Existen numerosos términos específicos de IA en la comunicación empresarial, y uno de los más nuevos es Fábrica de IA (AI Factory). El término no se refiere al uso de IA en instalaciones de fabricación, ni tampoco a una fábrica en la que los productos de IA salen de una cinta transportadora.
¿Qué es una Fábrica de IA?
Una fábrica de IA puede referirse a un centro de datos (la infraestructura física utilizada para producir la inteligencia artificial en sí), los datos y los modelos. Bradley Shimmin de Omdia, comenta que el término ha sufrido un pequeño cambio de contexto. Hace unos 18 meses, el término «Fábrica de IA» se habría referido a la infraestructura necesaria para construir y entrenar los grandes modelos (por ejemplo, ChatGPT-4o de OpenAI, Anthropic de Claude, Google Gemini, etc.). Sin embargo, hoy en día, «Fábrica de IA» describe mejor el producto de la inferencia (las predicciones o conclusiones producidas al ejecutar datos a través de un modelo de IA en vivo y ya entrenado).
Empresas utilizarían las redes y la infraestructura de Nvidia
La frase se ha utilizado esporádicamente durante los últimos años, pero generó titulares en junio de 2024 cuando, durante su discurso inaugural en Computex , el fundador y director ejecutivo de Nvidia , Jensen Huang, anunció que varias empresas utilizarían las redes y la infraestructura de Nvidia para empresas con el fin de construir fábricas de IA y centros de datos que impulsarían avances en IA generativa. Durante ese discurso, Huang dijo:
La próxima revolución industrial ya ha comenzado. Empresas y países se están asociando con NVIDIA para cambiar los centros de datos tradicionales, que cuestan billones de dólares, por una computación acelerada y construir un nuevo tipo de centro de datos (fábricas de IA) para producir un nuevo producto: la inteligencia artificial . Desde los fabricantes de servidores, redes e infraestructura hasta los desarrolladores de software, toda la industria se está preparando para que Blackwell acelere la innovación impulsada por la IA en todos los campos.
Jensen Huang, fundador y director ejecutivo de Nvidia
Huang también utilizó la frase durante su charla en Dell Technologies World en mayo de 2024, cuando comparó el concepto de “fábrica de IA” con las fábricas que, durante la revolución industrial, utilizaban agua para producir electricidad. Dijo que los centros de datos actuales transforman los datos y la electricidad para producir inteligencia que está “formulada como tokens, que luego pueden expresarse en cualquier modalidad de información que nos gustaría que fuera”.
Ya había utilizado el término
Huang ya había utilizado el término en marzo de 2022 cuando dijo que los centros de datos de IA procesan cantidades masivas de datos para entrenar y refinar los modelos de IA: “Los datos sin procesar entran, se refinan y la inteligencia sale: las empresas están fabricando inteligencia y operando fábricas gigantes de IA ”. En ese momento, Huang estaba promocionando el H100 de Nvidia, que fue creado para acelerar el entrenamiento de modelos de lenguaje grandes (LLM). En este contexto, parecía que el concepto de fábrica de IA se centraba en centros de datos diseñados para producir y entrenar modelos de IA.
Te podría interesar:
El término “Fábrica de IA” parece tener su origen en los profesores de Harvard Marco Iansiti y Karim Lakhani , quienes en 2020 publicaron el artículo “ Competir en la era de la IA ”, que más tarde dio lugar a un libro con el mismo nombre.
La fábrica de IA produce datos reales basados en eventos del mundo real
Según Shimmin, de Omdia, cuando una empresa (a través de sus empleados) utiliza la IA generativa para hacer cualquier cosa (crear un resumen de una reunión, una presentación, un discurso de marca), esa información generada por la IA se convierte en una parte viva del panorama de datos empresariales de esa empresa. En ese sentido, la fábrica de IA produce datos reales basados en eventos del mundo real.
Los datos sintéticos imitan los datos del mundo real
Una fábrica de IA también puede fabricar datos sintéticos para ayudar a un modelo a producir mejores resultados. Los datos sintéticos imitan las propiedades estadísticas en términos de estructura, características y funciones del conjunto de datos original del mundo real. Esos datos sintéticos (si la empresa los genera basándose en sus propios datos reales) ofrecen beneficios adicionales : menores costos asociados con la gestión y el análisis de datos, mayor control sobre la calidad y el formato del conjunto de datos, menor sesgo y mayor seguridad de los datos, etc.
Estos datos sintéticos podrían ayudar a las empresas a utilizar modelos más pequeños (por ejemplo, Microsoft Phi, Google Gemma, Llama de Meta y otros) que, si se entrenan con datos de calidad (reales o sintéticos), pueden ser extremadamente competitivos con los modelos básicos más grandes en términos de velocidad y eficiencia a la hora de realizar inferencias. Y los modelos más pequeños, en particular los de código abierto, se pueden ejecutar de forma privada, de modo que se pueden evitar posibles problemas de seguridad.
Te podría interesar:
¿PODRÍA UNA IA REEMPLAZAR A UN SICÓLOGO?
¿Podría una IA de cuarta generación reemplazar a un psicólogo o las terapias de psicología?
Resumen
Si bien el término fábrica de IA podría referirse a la infraestructura física utilizada para construir y entrenar grandes modelos de IA, su definición está cambiando y ahora una “fábrica de IA” se refiere a los resultados generados por un modelo de IA. Esos resultados podrían ser datos sintéticos que, a su vez, pueden usarse para entrenar nuevos modelos. En otras palabras, una fábrica de IA puede producir datos reales y sintéticos, así como futuros modelos de IA.
Fuentes adicionales:
Comentario de Bradley Shimmin de Omdia: https://www.nojitter.com/ai-speech-technologies/conversations-collaboration-omdia%25E2%2580%2599s-bradley-shimmin-ai-factories-%25E2%2580%2593-they%25E2%2580%2599re
Discurso inaugural en Computex: https://nvidianews.nvidia.com/news/computer-industry-ai-factories-data-centers
Fabricas gigantes de IA: https://blogs.nvidia.com/blog/ai-factories-hopper-h100-nvidia-ceo-jensen-huang/