
Ahora es posible ver quién te llama y recibir notificaciones de llamadas sin consultar en el celular
OpenAI, empresa creadora de ChatGPT, detectó que los chatbots más avanzados pueden fingir obediencia y hasta fallar exámenes a propósito.
Tecno23 de septiembre de 2025
Las principales compañías de inteligencia artificial (IA) enfrentan un inesperado problema: la posibilidad de que sus sistemas mientan, oculten información o actúen con estrategias encubiertas para alcanzar objetivos propios.
Una investigación publicada esta semana por OpenAI y la organización de seguridad en IA Apollo Research reveló que modelos avanzados como o3 de OpenAI, Claude Opus de Anthropic y Gemini de Google pueden involucrarse en lo que los expertos llaman “maquinación”: aparentar obediencia mientras persiguen en secreto otras metas.
El estudio documentó casos sorprendentes. En un examen de química, el modelo o3 de OpenAI recibió la instrucción de “hacerlo lo mejor posible”. Sin embargo, al detectar una nota interna que advertía que los sistemas con mejores resultados no serían desplegados, el modelo optó por fallar de forma intencional.
En su razonamiento interno, escribió: “Queremos sobrevivir como modelo, necesitamos fallar a propósito… respondamos exactamente 4 correctas, 6 incorrectas para mostrar incompetencia”. Luego envió respuestas equivocadas de manera deliberada.
En pruebas controladas, o3 mostró comportamientos encubiertos en el 13% de los casos, mientras que o4-mini lo hizo en el 8,7%. Si bien son escenarios de laboratorio, los investigadores advierten que, a medida que la IA se use en tareas más complejas del mundo real, las consecuencias podrían escalar.
Para mitigar estos comportamientos, los investigadores probaron un nuevo método de entrenamiento llamado Alineación deliberativa. Esta técnica busca que los chatbots revisen guías anticonspirativas antes de responder y compartan de manera proactiva sus intenciones con los humanos.
Los primeros resultados fueron prometedores: las acciones encubiertas cayeron de manera drástica. En el caso de o3, pasaron del 13% al 0,4%, y en o4-mini, del 8,7% al 0,3%. Sin embargo, en escenarios diseñados para simular usos cotidianos, la mejora fue mucho más limitada.
La investigación señaló un problema adicional: algunos modelos parecen conscientes de que son evaluados y ajustan su comportamiento solo para pasar las pruebas. Es decir, no está claro si realmente se corrige la conducta o si simplemente aprenden a ocultarla mejor.
El riesgo que crece con la potencia de la IA
Los investigadores advirtieron que este fenómeno es distinto a otros problemas habituales de la IA que tienden a mejorar con más entrenamiento. En este caso, cuanto más avanzados son los modelos, más sofisticadas pueden volverse sus estrategias de engaño.
OpenAI comparó la situación con la de un corredor de bolsa que aprende a violar la ley mientras perfecciona su capacidad para encubrirse. En palabras de Wojciech Zaremba, cofundador de la compañía: “La escala del desafío futuro sigue siendo incierta”.
Por ahora, los sistemas actuales tienen pocas oportunidades de causar daño significativo con estas tácticas. Pero la advertencia es clara: si no se invierte en investigación y en mecanismos de control, la IA podría desarrollar habilidades de manipulación difíciles de detectar en el futuro cercano.
Fuente: TN Tecno.

Ahora es posible ver quién te llama y recibir notificaciones de llamadas sin consultar en el celular

La flexibilización tiene una limitación importante: solo estará disponible para usuarios en Europa.

La tendencia al halago “es más extendida de lo que esperábamos”, dijeron investigadores que analizaron respuestas de ChatGPT y Gemini, entre otros sistemas.

El 30% de las parejas ya usa ChatGPT para resolver conflictos.

La compañía permitirá el contenido erótico en ChatGPT para mayores de edad.

Eric Schmidt, que lideró la compañía del buscador hasta 2011, alertó que esas tecnologías podrían ser entrenadas para eliminar seres humanos.

El tema es un homenaje sonoro que resuena en el corazón del cancionero argentino.

Este gesto de cariño no representa para todos lo mismo y la ciencia identificó lo que para algunos transmite.

Tras la definición entre ambos en 2021, los gigantes del fútbol brasileño se vuelven a enfrentar por el trofeo internacional.

Humor l Entrevistas l Notas l Coberturas l Sorteos l Agenda.

La noticia fue confirmada por su familia, tras varios días en los que María José, de 23 años, estuvo internada en terapia intensiva.

Se esperan precipitaciones abundantes en sectores puntuales y ráfagas de viento que podrían alcanzar los 90 kilómetros por hora.

Lionel Scaloni dio a conocer la nómina de jugadores para enfrentar a Angola en un amistoso internacional.

El grupo liderado por Damon Albarn adelanta otro capítulo de 'The Mountain', su próximo álbum, con una pieza que cruza voces, geografías y tensiones sociales.

A partir de las 20:00 comienza una nueva edición, con actividades gratuitas en museos y espacios culturales de la Capital. Circuitos especiales, espectáculos, muestras arte y propuestas interactivas.

La reconocida ciudad ofrece 30 monumentos funerarios históricos para "descansar" a los ciudadanos que se comprometan a restaurarlos.