Medal, uma plataforma para upload e compartilhamento de clipes de videogame, criou um novo laboratório de pesquisa de IA que está usando seu tesouro de vídeos de jogos para treinar e construir modelos básicos e agentes de IA que podem entender como objetos e entidades se movem no espaço e no tempo – um conceito conhecido como raciocínio espaço-temporal.
Chamada General Intuition, a startup aposta que o conjunto de dados da Medal – que consiste em 2 bilhões de vídeos por ano de 10 milhões de usuários ativos mensais em dezenas de milhares de jogos – supera alternativas como Twitch ou YouTube para treinamento de agentes.
“Quando você joga videogame, você essencialmente transfere sua percepção, geralmente por meio de uma visão da câmera em primeira pessoa, para diferentes ambientes”, disse Pim de Witte, CEO da Medal and General Intuition, ao TechCrunch. Ele observou que os jogadores que enviam clipes tendem a postar exemplos muito negativos ou positivos, que servem como casos extremos realmente úteis para o treinamento. “Você obtém esse viés de seleção precisamente em relação ao tipo de dados que realmente deseja usar para o trabalho de treinamento.”
Esse fosso de dados é o que supostamente atraiu a atenção da OpenAI, que no final do ano passado tentou adquirir a Medal por US$ 500 milhões, por A informação. (Nem a OpenAI nem a General Intuition comentaram o relatório.)
Foi também o que levou a General Intuition a levantar impressionantes US$ 133,7 milhões em financiamento inicial, liderado pela Khosla Ventures e General Catalyst com a participação de Raine.
A startup pretende usar os recursos para aumentar sua equipe de pesquisadores e engenheiros focados na formação de um agente geral que possa interagir com o mundo ao seu redor, visando aplicações iniciais em jogos e drones de busca e salvamento.
De Witte diz que a equipe fundadora já fez progressos: o modelo da General Intuition pode compreender ambientes nos quais não foi treinado e prever corretamente as ações dentro deles. É capaz de fazer isso puramente por meio de informações visuais; os agentes veem apenas o que um jogador humano veria e se movem pelo espaço seguindo as entradas do controlador. Esta abordagem, diz a empresa, pode ser transferida naturalmente para sistemas físicos como braços robóticos, drones e veículos autónomos, que são frequentemente manipulados por humanos através de controladores de videojogos.
Evento Techcrunch
São Francisco
|
27 a 29 de outubro de 2025
O próximo marco da General Intuition é duplo: gerar novos mundos simulados para treinar outros agentes e navegar de forma autônoma em ambientes físicos totalmente desconhecidos.
Essa abordagem técnica está a moldar a forma como a empresa planeia comercializar a sua tecnologia e distingue-a dos concorrentes que constroem modelos mundiais.
Embora a General Intuition também esteja construindo modelos mundiais para treinar seus agentes, tais modelos não são o produto. Ao contrário de outros fabricantes mundiais de modelos como DeepMind e World Labs que estão vendendo seus modelos mundiais Genie e Mármore para treinamento de agentes e criação de conteúdo, a General Intuition está se concentrando em outros casos de uso para evitar problemas de direitos autorais.
“Nosso objetivo não é produzir modelos que concorram com os desenvolvedores de jogos”, disse de Witte.
Em vez disso, os aplicativos de jogos da startup giram em torno da criação de bots e personagens não-jogadores que podem superar os tradicionais “bots determinísticos”, ou personagens pré-programados que produzem sempre o mesmo resultado.
“[The bots] pode escalar para qualquer nível de dificuldade”, disse Moritz Baier-Lentz, membro fundador da General Intuition e sócio da Lightspeed Ventures, ao TechCrunch. “Não é atraente criar um bot divino que supere todos, mas se você puder escalar gradualmente e preencher a liquidez para qualquer situação de jogador, de modo que sua taxa de vitória esteja sempre em torno de 50%, isso maximizará seu envolvimento e retenção.”
De Witte também tem experiência em trabalho humanitário, o que informa o foco da startup em alimentar drones de busca e resgate, que às vezes precisam navegar em ambientes desconhecidos e extrair informações sem GPS.
Em última análise, de Witte e Baier-Lentz veem a funcionalidade central da Intuição Geral – o raciocínio espaço-temporal – como uma peça crucial na corrida em direção à inteligência artificial geral (AGI). Embora os principais laboratórios de IA se concentrem na construção de modelos de linguagem grandes cada vez mais poderosos, a General Intuition acredita que a verdadeira AGI requer algo que falta fundamentalmente aos LLMs.
“Como humanos, criamos textos para descrever o que está acontecendo em nosso mundo, mas, ao fazer isso, perdemos muita informação”, disse de Witte. “Você perde a intuição geral em torno do raciocínio espaço-temporal.”