OpenAI lança modelos abertos de IA capazes de raciocínio complexo

A OpenAI anunciou nesta terça-feira o lançamento de dois novos modelos de inteligência artificial de peso aberto, chamados GPT-oss-120b e GPT-oss-20b. Disponíveis na plataforma Hugging Face, eles podem gerar textos, códigos e realizar buscas online mediante comandos dos usuários, sinalizando uma aproximação maior da IA à capacidade de raciocínio humano.

Modelos abertos e suas características

Segundo a OpenAI, os modelos têm a capacidade de executar tarefas complexas, como escrever códigos e buscar informações online. O diferencial está na transparência: ao divulgar os valores numéricos que aprenderam, a empresa permite que desenvolvedores personalizem e ajustem as versões conforme suas necessidades.

Os modelos, denominados de peso aberto (open-weight), são similares aos modelos LLaMA desenvolvidos pela Meta. Apesar de liberarem os pesos, a OpenAI não revelou os dados utilizados no treinamento, o que impede que esses sistemas sejam considerados completamente de código aberto (open source).

Contexto e estratégias da OpenAI com relação ao código aberto

Desde 2019, quando lançou o GPT-2, a OpenAI não promove modelos totalmente abertos. A decisão de liberar os novos modelos foi influenciada pelo lançamento do sistema de IA open R1 pela DeepSeek, em janeiro, e pelo reconhecimento de que a empresa precisa de uma nova estratégia de transparência.

De acordo com o CEO Sam Altman, a OpenAI considera o desenvolvimento de modelos abertos essenciais para dinamizar inovação e pesquisa. No entanto, a empresa mantém a cautela, adiando lançamentos por questões de segurança. Altman destacou: “Confiamos que a comunidade criará coisas incríveis com esse modelo, mas, uma vez que os pesos são divulgados, não há como voltar atrás”.

Atualizações e perspectiva futura

A empresa pretende que os modelos possam ser utilizados por indivíduos, empresas e governos para ajustes e execução em seus próprios hardwares. Já estão em testes plataformas como Orange e Snowflake, além de distribuições no repositório Bedrock da Amazon e pela infraestrutura de inferência da Groq e Humain AI.

Quanto à implementação, o modelo GPT-oss-120b pode operar em uma GPU de 80 gigabytes, enquanto o GPT-oss-20b funciona até em laptops com 16 gigabytes de memória, facilitando o uso em diferentes ambientes de computação.

Durante uma coletiva, a OpenAI afirmou que busca feedback dos usuários para definir futuros lançamentos de modelos de peso aberto, reforçando seu compromisso com avanços colaborativos na IA.

Para mais detalhes, acesse a matéria completa.

Com informações do Jornal Diário do Povo

Share this content:

Publicar comentário