Factory libera una app de escritorio — interfaz nativa de macOS y Windows para agentes de IA

Factory, una plataforma para construir agentes de IA autónomos, lanzó aplicaciones de escritorio nativas para macOS y Windows. La app de escritorio proporciona una interfaz nativa para diseñar, probar y monitorear flujos de trabajo de agentes, reduciendo latencia y mejorando la experiencia de desarrollo en comparación con acceso basado en navegador.

Por qué importa: Las herramientas orientadas al escritorio para desarrollo de agentes señalan un cambio hacia tratar la automatización de IA como un flujo de trabajo central — no solo una característica de chat experimental.

Leer más en Factory →

HeyGen lanza Avatar V — nuevo modelo de avatar con mayor realismo a partir de metraje de fuente corta

HeyGen lanzó Avatar V, un nuevo modelo de generación de avatar que produce avatares de mayor fidelidad a partir de clips de video más cortos e imágenes singulares. El modelo usa renderizado neural mejorado y síntesis de movimiento para reducir los requisitos de datos para creación de avatar mientras mantiene realismo en expresiones faciales y gestos.

Por qué importa: Una barrera de entrada más baja para creación de avatar expande casos de uso en localización de video, automatización de servicio al cliente y producción de medios sintéticos.

Leer más en HeyGen →

Kia planea usar robots humanoides Boston Dynamics Atlas en fábrica de EE.UU. desde 2029

Kia anunció planes para desplegar robots humanoides Boston Dynamics Atlas en su instalación de fabricación de Georgia comenzando en 2029, como parte de una estrategia más amplia para aumentar la automatización y adaptarse a dinámicas de fuerza laboral en evolución. Los robots manejarán tareas de ensamble repetitivas en la línea de producción de vehículos eléctricos.

Por qué importa: Los principales fabricantes de automóviles apostando en robots humanoides para ensamble señala confianza en la viabilidad a corto plazo y ROI de plataformas humanoides para despliegue de fábrica.

Leer más en Reuters →

Seedance 2.0 llega a Runway — texto a video con soporte de imagen y audio

Runway lanzó Seedance 2.0, un modelo de generación de video de terceros ahora disponible en la plataforma Runway, con nuevas capacidades para entrada multimodal. El modelo soporta indicadores de texto, imagen, video y audio, habilitando a los usuarios generar videos multiples tomas de referencias multimedia mixtas en un único flujo de trabajo.

Por qué importa: La generación de video multimodal reduce la fricción para creadores moviéndose de concepto a metraje terminado, abriendo nuevos casos de uso en publicidad y contenido de corta duración.

Leer más en Runway →

Anthropic supuestamente explorando diseño de su propio chip — competencia de computación se intensifica

Fuentes dijeron a Reuters que Anthropic está evaluando opciones para diseñar y fabricar sus propios chips de IA personalizados, uniéndose a un cambio más amplio hacia integración vertical en la industria de IA. La exploración refleja preocupaciones sobre disponibilidad de computación y precios a medida que la competencia por capacidad de GPU se intensifica en todos los laboratorios de frontera.

Por qué importa: Si Anthropic se compromete con chips personalizados, señala una inversión de capital a largo plazo en independencia de NVIDIA — y valida la importancia estratégica de poseer toda la pila de computación.

Leer más en El Chapuzas Informático →

Google Vids añade herramientas de video y música de IA — impulsado por Veo 3.1 y Lyria 3

Google añadió nuevas características de generación de video y música de IA a Google Vids, impulsado por modelos Veo 3.1 y Lyria 3. Los usuarios ahora pueden generar escenas de video y música de fondo directamente dentro de la interfaz de edición, agilizando el flujo de trabajo para crear contenido de marketing y promocional.

Por qué importa: Generación de video y música integrada en herramientas de edición accesibles democratiza la producción de contenido de grado profesional para pymes sin habilidades técnicas especializadas.

Leer más en What's New →

Google lanza Gemma 4 — última familia de modelos abiertos para razonamiento avanzado y flujos de trabajo agenticos

Google lanzó Gemma 4, el último modelo en su familia de código abierto Gemma, con mejoras significativas en razonamiento, seguimiento de instrucciones y planificación multietapa. Gemma 4 está optimizado para patrones agenticos y puede ejecutarse eficientemente en hardware de consumidor mientras compite con modelos propietarios más grandes en puntuaciones de razonamiento.

Por qué importa: Los modelos abiertos con capacidades de razonamiento de grado frontera aceleran la adopción en despliegues sensibles a costos y presión competitiva en estrategias de precios de modelos cerrados.

Leer más en MuyComputerPro →

Anthropic lanza Proyecto Glasswing — iniciativa de seguridad usando Claude Mythos Preview para asegurar software crítico

Anthropic anunció Proyecto Glasswing, una iniciativa de seguridad que aprovecha Claude Mythos Preview para analizar y mejorar la postura de seguridad de sistemas de software crítico. El programa empareja investigadores de seguridad y equipos de ingeniería con un asistente de IA avanzado entrenado para identificar vulnerabilidades, sugerir estrategias de remediación y auditar bases de código complejas para fallos de seguridad comunes.

Por qué importa: Usar IA frontera para asegurar infraestructura crítica representa una inversión de bien público neta positiva — y posiciona los modelos de Anthropic como esenciales para defenderse contra vectores de amenaza emergentes.

Leer más en Anthropic →

OpenAI añade tier Pro de $100 para Codex — límites de tasa más altos e inferencia más rápida

OpenAI introdujo un nuevo tier Pro de $100 por mes para Codex, su API de generación de código, ofreciendo límites de tasa significativamente más altos y acceso prioritario en comparación con el plan Plus. El tier apunta a equipos y empresas ejecutando cargas de trabajo de generación de código de producción que requieren capacidad dedicada.

Por qué importa: Los precios por niveles para APIs de codificación señalan que la demanda empresarial de generación de código de alto rendimiento justifica precios premium en la jerarquía de SaaS.

Leer más en OpenAI →

Claude Managed Agents entra en beta pública — inferencia agentica alojada en Claude

Anthropic anunció que Claude Managed Agents ha entrado en beta pública, ofreciendo un servicio alojado para construir y ejecutar agentes usando herramientas impulsados por Claude. La plataforma maneja gestión de contexto, invocación de herramientas, lógica de reintentos y manejo de errores, simplificando la complejidad operativa del despliegue de agentes autónomos.

Por qué importa: La inferencia administrada para agentes reduce la barrera para despliegues de producción, convirtiendo la agencia de un caso de uso avanzado en una oferta de producto estándar.

Leer más en Anthropic →

Gemini añade cuadernos para organización de proyectos — archivos, contexto y sincronización con NotebookLM

Google introdujo Notebooks como una nueva característica de Gemini, permitiendo a los usuarios organizar archivos, chats y contexto de proyecto en un único espacio de trabajo. Los cuadernos se sincronizan bidireccionalamente con NotebookLM, herramienta de investigación de Google, habilitando colaboración sin costuras entre flujos de trabajo conversacional y análisis a largo plazo.

Por qué importa: Vincular la interfaz de chat de Gemini a espacios de proyecto estructurados posiciona a Google para capturar más del ciclo de vida de "flujo de pensamiento", compitiendo con herramientas de investigación especializadas.

Leer más en Hipertextual →

Gemini añade modelos 3D interactivos y gráficos — genera simulaciones interactivas en la app

Google desplegó la capacidad para que Gemini genere modelos 3D interactivos y gráficos dinámicos directamente dentro de la interfaz de chat. Los usuarios ahora pueden rotar modelos, ajustar parámetros y explorar visualizaciones de datos sin salir de Gemini, facilitando el razonamiento sobre conceptos espaciales y cuantitativos de manera conversacional.

Por qué importa: Salidas más ricas dentro de la app reducen fricción para usuarios que quieren ir de pregunta a visualización de trabajo — mejorando el atractivo de Gemini para educación y trabajo técnico.

Leer más en What's New →

Meta libera Muse Spark — primer modelo del equipo Meta Superintelligence Labs, disponible a través de Meta AI app

Meta lanzó Muse Spark, el primer modelo de producción del equipo Superintelligence Labs recientemente establecido, con disponibilidad inicial a través de la app Meta AI y móvil. El modelo está sintonizado para conversaciones multiturnos y tareas de razonamiento, con despliegue planeado en todo el ecosistema de Meta incluyendo WhatsApp e Instagram.

Por qué importa: Meta consolidando su investigación de IA bajo un grupo de superinteligencia dedicado señala un reinicio competitivo después de meses de crítica por quedar rezagado en capacidad de IA frontera.

Leer más en The Verge →

Agile Robots se asocia con Google DeepMind — integrando modelos Gemini Robotics en sistemas de producción

Agile Robots anunció una asociación con Google DeepMind para integrar la familia de modelos Gemini Robotics en sus sistemas de manipulación y control. La colaboración empareja hardware especializado de Agile Robots con modelos de razonamiento y percepción multimodal de Google, apuntando a flujos de trabajo de automatización industrial.

Por qué importa: Las principales firmas de robótica integrando modelos fundacionales de gigantes tecnológicos señala que los modelos de robótica personalizada están convergiendo en infraestructura de mercadería.

Leer más en TechCrunch →

Skild AI despliega software de robótica en líneas de ensamble de Foxconn — ejecutando inferencia en sistemas Nvidia Blackwell

Skild AI anunció el despliegue de su pila de software de robótica en líneas de fabricación de Foxconn, donde está ejecutando cargas de trabajo de inferencia en chips Nvidia Blackwell. La asociación pone modelos visuales y de control en uso de producción directo, manejando toma de decisiones en tiempo real para tareas de ensamble construyendo hardware de IA de gama alta.

Por qué importa: Modelos de robótica en fabricación de producción prueban la economía y confiabilidad de automatización impulsada por IA a escala — y alimentan datos nuevamente a la próxima iteración de modelos.

Leer más en Reuters →

Perplexity expande integración de Plaid — conectando más tipos de cuenta para finanzas asistidas por IA

Perplexity desplegó integración más profunda con Plaid, habilitando su asistente de IA para conectarse a más tipos de cuenta e instituciones financieras. La asociación expandida permite a los usuarios hacer preguntas en lenguaje natural al asistente sobre sus saldos bancarios, transacciones y carteras financieras sin salir de la interfaz de chat.

Por qué importa: Los asistentes de IA ganando acceso directo a datos financieros representan un cambio en cómo los consumidores interactúan con su dinero — y a dónde fluyen los datos financieros en la pila tecnológica.

Leer más en Plaid →

Broadcom firma acuerdo a largo plazo con Google para chips de IA — cementando asociaciones de silicio personalizado

Broadcom anunció una asociación estratégica a largo plazo con Google para desarrollar y suministrar chips de IA personalizados, incluyendo arquitecturas de silicio propietarias de Google. El acuerdo se extiende a través de infraestructura de centros de datos y refleja la tendencia más amplia de la industria hacia computación integrada verticalmente, con Anthropic incrustada en el contexto más amplio de inversiones en chips competidoras.

Por qué importa: Los acuerdos de silicio personalizado bloquean capacidad de fabricación y diferenciación — las empresas que invierten temprano en chips propietarios ganan ventajas de costo y desempeño duraderas.

Leer más en La República →

Z.ai libera GLM-5.1 — modelo buque insignia para trabajo estilo agente y razonamiento avanzado

Z.ai lanzó GLM-5.1, un nuevo modelo buque insignia diseñado para flujos de trabajo agenticos de horizonte largo y tareas de ingeniería. El modelo está posicionado para cadenas de razonamiento complejas, generación de código y resolución de problemas autónoma con mejor desempeño en razonamiento multietapa en comparación con su predecesor.

Por qué importa: Más modelos agentes propósito-específicos aumentan la presión competitiva en laboratorios fundacionales para especializar más allá de puntuaciones de capacidad pura.

Leer más en Z.ai →