Desde então O DeepSeek entrou em cena em janeiro, e o impulso cresceu em torno dos modelos de inteligência synthetic chineses de código aberto. Alguns pesquisadores estão pressionando por uma abordagem ainda mais aberta para a construção de IA, que permita que a criação de modelos seja distribuída por todo o mundo.
Intelecto Primordialuma startup especializada em IA descentralizada, está atualmente treinando um grande modelo de linguagem de fronteira, chamado INTELLECT-3, usando um novo tipo de aprendizagem por reforço distribuído para ajuste fino. O modelo demonstrará uma nova forma de construir modelos de IA abertos e competitivos, utilizando uma gama de {hardware} em diferentes locais, de uma forma que não depende de grandes empresas tecnológicas, afirma Vincent Weisser, CEO da empresa.
Weisser diz que o mundo da IA está atualmente dividido entre aqueles que dependem de modelos fechados dos EUA e aqueles que usam ofertas abertas da China. A tecnologia que a Prime Mind está desenvolvendo democratiza a IA, permitindo que mais pessoas construam e modifiquem IA avançada por si mesmas.
Melhorar os modelos de IA não é mais uma questão de apenas aumentar os dados de treinamento e a computação. Os modelos de fronteira atuais usam o aprendizado por reforço para melhorar após a conclusão do processo de pré-treinamento. Quer que seu modelo se destaque em matemática, responda questões jurídicas ou jogue Sudoku? Faça com que ele melhore praticando em um ambiente onde você possa medir o sucesso e o fracasso.
“Esses ambientes de aprendizagem por reforço são agora o gargalo para realmente dimensionar as capacidades”, disse-me Weisser.
Prime Mind criou uma estrutura que permite a qualquer pessoa criar um ambiente de aprendizagem por reforço personalizado para uma tarefa específica. A empresa está combinando os melhores ambientes criados por sua própria equipe e pela comunidade para sintonizar o INTELLECT-3.
Tentei rodar um ambiente para resolver quebra-cabeças do Wordle, criado pelo pesquisador da Prime Mind, Will Brown, observando como um pequeno modelo resolvia os quebra-cabeças do Wordle (period mais metódico do que eu, para ser sincero). Se eu fosse um pesquisador de IA tentando melhorar um modelo, eu usaria um monte de GPUs e faria o modelo praticar continuamente enquanto um algoritmo de aprendizado por reforço modificava seus pesos, transformando assim o modelo em um mestre Wordle.