Desde mi Ventana: 05/06/25

martes, 6 de mayo de 2025

ChatGPT Alucinando

El problema de alucinaciones de ChatGPT está empeorando según las propias pruebas de OpenAI y nadie entiende por qué.

¿Recuerdan ...no..no creo que recuerden, pero me referí hace cierto tiempo; como las otras versiones de lo que llamamos Open Source, explicaban la reciente incorporación del Razonamiento o Deep Thinking?

Pues bien, a ese misterio que rodea a los últimos grandes modelos de lenguaje (LLM), junto con innumerables otros, ahora se suma el empeoramiento de las alucinaciones. Y esto según las pruebas de OpenAI, la empresa líder en chatbots.

El New York Times informa que una investigación de OpenAI sobre sus últimos grandes LLM GPT o3 y GPT o4-mini reveló que son sustancialmente más propensos a alucinar o a inventar información falsa que el anterior modelo GPT o1.

La compañía descubrió que o3, su sistema más potente, alucinaba el 33 % del tiempo al ejecutar su prueba de referencia PersonQA, que consiste en responder preguntas sobre figuras públicas.

Esto representa más del doble de la tasa de alucinaciones del sistema de razonamiento anterior de OpenAI, llamado o1. El nuevo o4-mini alucinaba a una tasa aún mayor: 48 % —según el Times—.

Al ejecutar otra prueba llamada SimpleQA, que plantea preguntas más generales, las tasas de alucinaciones para o3 y o4-mini fueron del 51 % y 79 % respectivamente. El sistema anterior, o1, alucinaba el 44 % del tiempo.

OpenAI ha afirmado que se necesita más investigación para comprender por qué los modelos más recientes son más propensos a las alucinaciones. Sin embargo, los llamados modelos de "razonamiento" son los principales candidatos, según algunos analistas del sector.

"Las tecnologías más nuevas y potentes —los llamados sistemas de razonamiento de empresas como OpenAI, Google y la startup china DeepSeek— están generando más errores, no menos", afirma el Times.

En pocas palabras, los modelos de razonamiento son un tipo de LLM diseñado para realizar tareas complejas. En lugar de simplemente generar texto basado en modelos estadísticos de probabilidad, los modelos de razonamiento descomponen las preguntas o tareas en pasos individuales, similares al proceso de pensamiento humano.

El primer modelo de razonamiento de OpenAI, o1, se lanzó el año pasado y se afirmaba que igualaba el rendimiento de los estudiantes de doctorado en física, química y biología, y los superaba en matemáticas y programación gracias al uso de técnicas de aprendizaje por refuerzo.

"De forma similar a cómo un humano puede pensar durante mucho tiempo antes de responder a una pregunta difícil, o1 utiliza una cadena de pensamiento al intentar resolver un problema", declaró OpenAI cuando se lanzó o1.

Sin embargo, OpenAI ha refutado la idea de que los modelos de razonamiento sufren un aumento en las tasas de alucinación. "Las alucinaciones no son inherentemente más frecuentes en los modelos de razonamiento, aunque estamos trabajando activamente para reducir las tasas más altas de alucinaciones que observamos en o3 y o4-mini", declaró Gaby Raila de OpenAI al Times.

Sea cual sea la verdad, una cosa es segura. Los modelos de IA deben eliminar en gran medida las tonterías y las mentiras para que sean tan útiles como sus defensores actualmente prevén. Actualmente, es difícil confiar en los resultados de cualquier LLM.

Prácticamente todo debe verificarse cuidadosamente.

Eso está bien para algunas tareas. Pero cuando el principal beneficio es ahorrar tiempo o trabajo, la necesidad de comprobar y verificar meticulosamente los resultados de la IA frustra el objetivo de su uso.

Queda por ver si OpenAI y el resto de la industria de LLM pueden controlar todos esos sueños robóticos no deseados.

Mis Libros, en formato Flipbook

Robots en las hamburgueserías

En algunas hamburgueserías innovadoras, los robots se encargan de recibir y preparar los pedidos, logrando reducir significativamente el tiempo de espera. Gracias a esta automatización, los clientes pueden obtener sus hamburguesas en menos de medio minuto.

Burgerbots: la revolución robótica aterriza en la comida rápida

En pleno corazón de Silicon Valley, donde la innovación parece no tener límites, los restaurantes Burgerbots han abierto sus puertas con una propuesta insólita: autómatas que preparan hamburguesas en apenas 27 segundos. La idea, liderada por Elizabeth Truong y realizada junto a ABB Robotics, busca introducir una nueva dosis de eficiencia al servicio de comida. El concepto se ha materializado en Los Gatos, ciudad californiana sede de empresas icónicas como Netflix, reflejando el pulso tecnológico de la región.

Funcionamiento y ventajas tecnológicas

¿En qué consiste exactamente esta experiencia? La mecánica es sorprendente: un robot selecciona los ingredientes correctos, guiado por un código QR incluido en cada bandeja; otro autómata realiza el ensamblaje final. En menos de medio minuto, la hamburguesa pasa a manos de un camarero humano que completa el ciclo con la entrega al cliente. Esta precisión elimina errores frecuentes y, según afirma Truong, los robots «no toman descansos» ni presentan problemas habituales del personal tradicional.

Desde la perspectiva técnica, Marc Segura, presidente de la División de Robótica en ABB, subraya el potencial del avance: «La integración de los robots en Burgerbots demuestra el increíble potencial de la automatización más allá de la planta de producción». Para el sector gastronómico —tan dinámico y exigente— esta tecnología implica una promesa de «consistencia, eficiencia y fiabilidad industrial».

Dudas e inquietudes sobre el empleo humano

No obstante, surge inevitablemente una preocupación central: ¿qué impacto tendrá esta automatización sobre el mercado laboral? El propio New York Post advierte que «automatizar el proceso puede parecer duro para los empleados humanos en un momento en que las máquinas amenazan con dejar obsoletas diversas profesiones y labores». Los impulsores del proyecto matizan que no buscan reemplazar totalmente a las personas; más bien aspiran a liberar al personal humano para que se enfoque en crear experiencias gastronómicas únicas.

Varias cifras refuerzan estas dudas: según estimaciones del Foro Económico Mundial, cerca de 92 millones de puestos podrían desaparecer globalmente antes de 2030 debido a la automatización y la inteligencia artificial. Entre los más vulnerables figuran precisamente los empleados de comida rápida y cajeros.

Mira hacia el futuro: colaboración hombre-máquina o sustitución total?

Así las cosas, aunque hoy se presentan como aliados incansables —que nunca necesitan pausas ni generan imprevistos— los robots abren un intenso debate sobre cómo será el empleo del mañana. Y si bien la eficiencia convence por ahora al consumidor acelerado, persisten interrogantes sobre el verdadero equilibrio entre progreso tecnológico y sostenibilidad social.

Cuantas Veces Usa uno de estos Sitios WEB ?

Google se consolida como el sitio web más visitado del mundo, con 136 mil millones de visitas mensuales en noviembre de 2024. En segundo lugar se encuentra YouTube. Este sitio de streaming de vídeo tiene un tiempo promedio por visita de casi 25 minutos.

En general, ChatGPT ocupa el noveno lugar a nivel mundial, con 4.8 mil millones de visitas mensuales. Hoy en día, las grandes empresas tecnológicas siguen dominando el tráfico web, y Google acapara el 90 % de las búsquedas solo en EE. UU. En particular, Alphabet y Meta se encuentran entre los 10 sitios web con mayor tráfico mensual a nivel mundial, generando miles de millones en ingresos publicitarios gracias a su sólida cuota de mercado. Sin embargo, nuevos actores como ChatGPT están ascendiendo rápidamente en la clasificación.

Este gráfico muestra los sitios web más visitados del mundo, según datos de SEMRush a través de Datareportal. Google lidera con creces Aquí están los 20 sitios web más visitados del mundo en noviembre de 2024: Los visitantes únicos representan la cantidad de personas que visitan un sitio, contándose cada visitante una vez, independientemente del número de visitas durante ese período. Como muestra la tabla anterior, las visitas mensuales de Google superan a las de los siguientes 10 sitios web principales en conjunto. Alphabet, la empresa matriz de Google, se enfrenta a crecientes demandas por su monopolio en las búsquedas en línea.

Los reguladores están examinando de cerca los acuerdos de búsqueda predeterminados, incluidos los que mantiene con Apple, donde Alphabet paga una parte de los ingresos para asegurar la posición de Google como motor de búsqueda predeterminado en Safari.

Por ejemplo, Alphabet pagó a Apple 20 000 millones de dólares como parte de este acuerdo en 2021. En sexto lugar se encuentra Reddit, con 91 millones de usuarios activos diarios. En el primer semestre de 2024, se crearon 5300 millones de publicaciones en la plataforma, un aumento interanual del 21 %. Con miles de subreddits activos, la plataforma es conocida como "la página principal de internet".

Como la herramienta de IA más popular del mundo en cuanto a visitas mensuales, ChatGPT se sitúa entre los 10 sitios web más populares a nivel mundial. Con 400 millones de usuarios semanales, OpenAI, creador de ChatGPT, está valorado en 300 000 millones de dólares. Mientras tanto, TikTok ocupa el puesto 20 en general, con 2500 millones de visitas mensuales, muy por detrás de los 6800 millones de Instagram.

Usando Chats desde lo Básico

Desde Noviembre del año 2022, he dedicado incontables horas a probar chatbots de IA. Los he llevado a hacer prácticamente de todo, desde generar ideas hasta explicar política global e incluso ayudarme a decidir entre dos tipos de recetas de cocina, realizadas por distintos Chefs Internacionales.

Después de cientos de indicaciones (y muchas que no me funcionaron), he encontrado varias que funcionan de forma consistente en todas las plataformas, tonos y complejidad. Tanto si usted querido amigo es un principiante en IA como si eres un experto en indicaciones, estas cinco indicaciones son versátiles, fiables y sorprendentemente eficaces para cualquier chatbot que elijas.

Ya sea que tu favorito sea ChatGPT, Gemini, Claude, Perplexity, DeepSeek o una combinación de todos, estas indicaciones te servirán. Te podría gustar estas indicaciones las cuales son a las que recurro una y otra vez: para el trabajo, para aprender y, ocasionalmente, para pedir consejos a las 2 de la madrugada. Aquí tienes las que han triunfado. (He dejado de lado en esta primera parte, la producción de imagenes, porque ese tema me apasiona y le voy a dedicar un artículo completo)

1. La Idea....esa idea básica, "Explícalo como si fuera un genio de 10 años"

Cuándo usarla: Este es mi prompt predilecto cuando quiero entender algo complejo, pero no tengo tiempo para leer un libro de texto durante horas ni para ver una charla TED. Sin embargo, como no quiero que el concepto se explique con unicornios y perritos mas gatitos, añadí "genio" para que la comprensión sea más madura.

Prompt: "Explica [tema] en términos sencillos, pero no simplificados. Usa una analogía vívida y divídela en tres conclusiones clave. Supón que soy inteligente, pero no estoy familiarizado con la jerga". Por qué funciona: * ChatGPT-4o ofrece analogías ingeniosas que se mantienen, como "los bits cuánticos giran como monedas hasta que se observan". * Claude 3 estructura cada respuesta con ideas organizadas y fragmentos fáciles de digerir. * Géminis tiende a descontrolarse, pero añadir una analogía vívida lo controla y ayuda a que cualquier tema sea más comprensible.

* Consejo profesional: Si la explicación te parece demasiado básica, continúa con: "Ahora dame la versión de doctorado, con una aplicación sorprendente en el mundo real".

* 2. El Prompt "Corrige mi escritura" Cuándo usarla: Después de escribir un correo electrónico, una publicación o incluso una actualización de LinkedIn, a veces todavía parece un borrador. Si algo no me convence o falta algún detalle en particular, uso esta instrucción para ayudarme a encontrar lo que me perdí.. A veces no lo sabes hasta que preguntas, y ahí es donde los chatbots pueden ser de gran ayuda. Indicación: «Reescribe este [correo electrónico/publicación] para que suene más [conciso/persuasivo/ingenioso]. Que no tenga más de [X palabras]. Marca las frases vagas y sugiere tres frases iniciales más contundentes». Por qué funciona: * Claude 3 es excepcional con el tono y la estructura. * ChatGPT-4o se vuelve creativo, a veces de forma inesperada, ofreciendo nuevas perspectivas. * Perplexity puede verificar estadísticas u ofrecer citas cuando se le pide.

* Victoria en la vida real: Claude me ayudó a eliminar el 40 % de la información superflua de una publicación de LinkedIn, y ChatGPT me proporcionó una mejor frase inicial que triplicó la interacción.

martes, 6 de mayo de 2025

Robots en las hamburgueserías: pedidos listos en menos de 30 segundos

Burgerbots: la revolución robótica aterriza en la comida rápida

Funcionamiento y ventajas tecnológicas

Dudas e inquietudes sobre el empleo humano

Mira hacia el futuro: colaboración hombre-máquina o sustitución total?