OpenAI lança modelos abertos de IA capazes de raciocínio complexo
A OpenAI anunciou nesta terça-feira o lançamento de dois novos modelos de inteligência artificial de peso aberto, chamados GPT-oss-120b e GPT-oss-20b. Disponíveis na plataforma Hugging Face, eles podem gerar textos, códigos e realizar buscas online mediante comandos dos usuários, sinalizando uma aproximação maior da IA à capacidade de raciocínio humano.
Modelos abertos e suas características
Segundo a OpenAI, os modelos têm a capacidade de executar tarefas complexas, como escrever códigos e buscar informações online. O diferencial está na transparência: ao divulgar os valores numéricos que aprenderam, a empresa permite que desenvolvedores personalizem e ajustem as versões conforme suas necessidades.
Os modelos, denominados de peso aberto (open-weight), são similares aos modelos LLaMA desenvolvidos pela Meta. Apesar de liberarem os pesos, a OpenAI não revelou os dados utilizados no treinamento, o que impede que esses sistemas sejam considerados completamente de código aberto (open source).
Contexto e estratégias da OpenAI com relação ao código aberto
Desde 2019, quando lançou o GPT-2, a OpenAI não promove modelos totalmente abertos. A decisão de liberar os novos modelos foi influenciada pelo lançamento do sistema de IA open R1 pela DeepSeek, em janeiro, e pelo reconhecimento de que a empresa precisa de uma nova estratégia de transparência.
De acordo com o CEO Sam Altman, a OpenAI considera o desenvolvimento de modelos abertos essenciais para dinamizar inovação e pesquisa. No entanto, a empresa mantém a cautela, adiando lançamentos por questões de segurança. Altman destacou: “Confiamos que a comunidade criará coisas incríveis com esse modelo, mas, uma vez que os pesos são divulgados, não há como voltar atrás”.
Atualizações e perspectiva futura
A empresa pretende que os modelos possam ser utilizados por indivíduos, empresas e governos para ajustes e execução em seus próprios hardwares. Já estão em testes plataformas como Orange e Snowflake, além de distribuições no repositório Bedrock da Amazon e pela infraestrutura de inferência da Groq e Humain AI.
Quanto à implementação, o modelo GPT-oss-120b pode operar em uma GPU de 80 gigabytes, enquanto o GPT-oss-20b funciona até em laptops com 16 gigabytes de memória, facilitando o uso em diferentes ambientes de computação.
Durante uma coletiva, a OpenAI afirmou que busca feedback dos usuários para definir futuros lançamentos de modelos de peso aberto, reforçando seu compromisso com avanços colaborativos na IA.
Para mais detalhes, acesse a matéria completa.
Com informações do Jornal Diário do Povo
Share this content:










Publicar comentário