强化微调研究项目

OpenAI推出强化微调研究项目

据报道,AI初创公司OpenAI启动了为期12天的直播活动。活动首日,推出了完整版(满血版)o1推理模型,并新增了月费为200美元的ChatGPT Pro订阅。直播第二天, OpenAI推出了强化微调研究项目。该项目旨在使开发人员和机器学习工程师能够创建经过微调的专家模型。新的模型自定义技术使开发人员能够使用数十到数千个高质量任务定制模型,并根据提供的参考答案对模型的响应进行分级。