Início Tecnologia O Google Cloud visa CoreWeave e AWS com Slurm gerenciado para treinamento...

O Google Cloud visa CoreWeave e AWS com Slurm gerenciado para treinamento de IA em escala empresarial

10
0

Algumas empresas são mais bem atendidas ajustando grandes modelos às suas necessidades, mas várias empresas planejam construir seus próprios modelosum projeto que exigiria acesso a GPUs.

O Google Cloud quer desempenhar um papel maior na jornada de criação de modelos das empresas com seu novo serviço, Treinamento da Vertex AI. O serviço oferece às empresas que desejam treinar seus próprios modelos acesso a um ambiente Slurm gerenciado, ferramentas de ciência de dados e quaisquer chips capazes de treinar modelos em larga escala.

Com este novo serviço, o Google Cloud espera afastar mais empresas de outros fornecedores e incentivar a construção de modelos de IA mais específicos para cada empresa.

Embora o Google Cloud sempre tenha oferecido a capacidade de personalizar seus modelos Gemini, o novo serviço permite que os clientes tragam seus próprios modelos ou personalizem qualquer modelo de host do Google Cloud de código aberto.

O Vertex AI Coaching posiciona o Google Cloud diretamente contra empresas como CoreWeave e Laboratórios Lambdabem como seus concorrentes em nuvem AWS e Microsoft Azure.

Jaime de Guerre, diretor sênior de gerenciamento de produtos da Gloogle Cloud, disse à VentureBeat que a empresa tem ouvido de muitas organizações de tamanhos variados que precisam de uma maneira de otimizar melhor a computação, mas em um ambiente mais confiável.

“O que estamos vendo é que há um número crescente de empresas que estão construindo ou customizando modelos de IA de grande geração para apresentar uma oferta de produtos construída em torno desses modelos, ou para ajudar a impulsionar seus negócios de alguma forma”, disse de Guerre. “Isso inclui startups de IA, empresas de tecnologia, organizações soberanas que constroem um modelo para uma determinada região, cultura ou idioma e algumas grandes empresas que podem estar incorporando isso em processos internos.”

De Guerre observou que, embora qualquer pessoa possa usar tecnicamente o serviço, o Google tem como alvo empresas que planejam treinamento de modelos em grande escala, em vez de simples ajustes finos ou adotantes de LoRA. Os Vertex AI Companies se concentrarão em trabalhos de treinamento de longa duração, abrangendo centenas ou até milhares de chips. O preço dependerá da quantidade de computação que a empresa precisará.

“O Vertex AI Coaching não serve para adicionar mais informações ao contexto ou usar RAG; trata-se de treinar um modelo onde você pode começar com pesos completamente aleatórios”, disse ele.

Personalização de modelos em ascensão

As empresas estão reconhecendo o valor de construir modelos personalizados além de apenas ajustar um LLM por meio da geração aumentada por recuperação (RAG). Os modelos personalizados conheceriam informações mais detalhadas da empresa e responderiam com respostas específicas para a organização. Empresas como Arcee.ai começaram oferecendo seus modelos para personalização aos clientes. Adobe anunciou recentemente um novo serviço que permite às empresas treinar novamente o Firefly para suas necessidades específicas. Organizações como FICOque criam pequenos modelos de linguagem específico para o setor financeiromuitas vezes compram GPUs para treiná-los a um custo significativo.

O Google Cloud disse que o Vertex AI Coaching se diferencia por dar acesso a um conjunto maior de chips, serviços para monitorar e gerenciar o treinamento e a experiência que aprendeu com o treinamento dos modelos Gemini.

Alguns dos primeiros clientes do Vertex AI Coaching incluem IA Singapuraum consórcio de institutos de pesquisa e startups de Singapura que construiu o SEA-LION v4 de 27 bilhões de parâmetros, e Força de vendasequipe de pesquisa de IA.

As empresas muitas vezes têm que escolher entre pegar um LLM já construído e ajustá-lo ou construir seu próprio modelo. Mas criar um LLM do zero geralmente é inatingível para empresas menores ou simplesmente não faz sentido para alguns casos de uso. No entanto, para organizações onde faz sentido um modelo totalmente personalizado ou do zero, o problema é obter acesso às GPUs necessárias para executar o treinamento.

O treinamento do modelo pode ser caro

Treinar um modelo, disse de Guerre, pode ser difícil e caroespecialmente quando as organizações competem com diversas outras por espaço de GPU.

Hiperescaladores como AWS e Microsoft – e, sim, Google – argumentaram que seus enormes information facilities e racks e racks de chips de alta tecnologia agregam mais valor às empresas. Eles não apenas terão acesso a GPUs caras, mas os provedores de nuvem geralmente oferecem serviços full-stack para ajudar as empresas a passarem para a produção.

Serviços como o CoreWeave ganharam destaque por oferecer acesso sob demanda a Nvidia H100s, oferecendo aos clientes flexibilidade no poder computacional ao criar modelos ou aplicativos. Isto também deu origem a um modelo de negócios em que empresas com GPUs alugam espaço em servidores.

De Guerre disse que o Vertex AI Coaching não se trata apenas de oferecer acesso para treinar modelos em computação simples, onde a empresa aluga um servidor GPU; eles também precisam trazer seu próprio software program de treinamento e gerenciar o tempo e as falhas.

“Este é um ambiente Slurm gerenciado que ajudará em todo o agendamento de trabalhos e na recuperação automática de trabalhos que falharam”, disse de Guerre. “Portanto, se um trabalho de treinamento ficar lento ou parar devido a uma falha de {hardware}, o treinamento será reiniciado automaticamente muito rapidamente, com base na verificação automática que fazemos no gerenciamento dos pontos de verificação para continuar com muito pouco tempo de inatividade.”

Ele acrescentou que isso proporciona maior rendimento e treinamento mais eficiente para uma escala maior de clusters de computação.

Serviços como o Vertex AI Coaching podem tornar mais fácil para as empresas construir modelos de nicho ou personalizar completamente os modelos existentes. Ainda assim, só porque a opção existe não significa que seja adequada para todas as empresas.

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui