世博
当前位置: 首页 > 应用案例

应用案例

OpenAI发布季第九天:o1模型开放API使用实时语音API大降价

来源:世博 时间:2025-03-04 09:57:53

  OpenAI发布季第 9 天: 备受期待的 o1 模型终于向开发者开放使用了!

  这次更新不仅让开发者可使用更强大的 AI 模型,还大幅度降低了使用成本。比如说,过去需要不少费用才能用的语音功能,现在价格直接降低了 60%。对于预算有限的开发者来说,他们还特别推出了一个迷你版的语音服务,费用只有原来的十分之一。具体更新内容包括:

  实时 API 升级:集成简单的 WebRTC 功能,GPT-4o 音频价格下调 60%,同时推出 GPT-4o mini,音频费用仅为原来的十分之一。

  偏好微调 (Preference Fine-Tuning):新一代模型定制技术,帮助开发者更轻松地按照每个用户需求和偏好优化模型。

  这些进步意味着什么呢?简单来说,就是AI 应用的开发变得更简单、更便宜,也更容易根据具体需求进行定制了。不管是想开发智能客服、自动翻译,还是其他创新应用,开发者们都能以更低的成本实现自己的想法。

  全新的 o1 模型,这是一次重要的技术升级。相比之前的版本,新模型不仅变得更聪明,还能更快地回应客户的真实需求。目前,该模型已经向高级开发者开放使用,并计划逐步扩大开放范围。这次升级带来了哪些实际改进?

  这些进步意味着什么?未来个人会使用的各种 AI 应用都会变得更聪明、更快速、更符合实际需求。不管是在线购物时的智能推荐,还是工作中需要的数据分析,都能得到更优秀的支持。

  目前,OpenAI 正在分批向开发者开放 o1 模型的使用权限。随着更多开发者加入,我们有望看到更多创新的 AI 应用出现在我们的日常生活中。开放访问权限,并计划扩展到更高的使用等级,同时持续提升速率限制。

  OpenAI 的 实时 API 让开发的人能构建流畅、自然的实时对话体验,适用于语音助手、实时翻译工具、虚拟导师、交互式客服系统,甚至是你自己的“虚拟圣诞老人”。他们推出了一系列重要改进,包括直接支持 WebRTC、降低价格和更灵活的响应控制。

  实时 API 增加了对 WebRTC 的支持。作为一项开放标准,WebRTC 让开发者能够跨平台轻松构建和扩展实时语音产品,无论是浏览器应用、移动端、物联网设备,还是服务器间通信。WebRTC 集成确保在真实网络条件下提供高效、低延迟的交互体验,能够应对网络质量波动,支持音频编码、流式传输、噪音抑制和拥堵控制等功能。

  OpenAI 在语音服务领域推出了重大更新,不仅大幅下调了原有服务的价格,还推出了价格更加亲民的迷你版服务。原有的 GPT-4o 语音服务在技术层面获得了显著提升,特别在语音识别的准确性方面有了明显进步,尤其是在处理数字语音时的表现更出色。主要更新包括:

  更令人瞩目的是全新推出的 GPT-4o mini 迷你版服务。这个版本在保持与完整版相同的语音质量的同时,将价格降至原来的四分之一。其定价方案为:

  这次价格调整和新服务的推出具有深远的意义。对于开发者而言,明显降低的成本意味着他们能够将更多资源投入到应用的创新和优化上。而对于最终用户来说,这在某种程度上预示着他们将有机会接触到更多、更好的语音交互应用,而且使用成本会更加实惠。

  这些更新已经在 OpenAI 的实时 API 和 Chat Completions API 中全面上线,开发的人能立即开始体验这些新功能。这次重大更新无疑将推动语音交互应用的普及,让 AI 语音技术在更多场景中发挥作用。

  OpenAI 为实时 API 推出了更多控制选项,帮助开发者实现高效、精准的语音体验:

  自定义上下文输入:灵活选择输入内容,例如单独审核用户的最后一句话,或在会话中重用历史响应。

  受控响应时机:借助服务器端 语音活动检测 (VAD),开发者可在回复前预先收集所需信息并精准控制响应时机。

  OpenAI 最新推出的偏好微调(Preference Fine-Tuning)功能,让 AI 模型的个性化定制变得更简单和高效。这项技术采用了一种叫做直接偏好优化(DPO)的创新方法,通过对比不同的 AI 回答,让模型学会识别什么样的回答更符合用户的偏好。

  这与传统的模型训练方法有着本质的区别。传统的监督式微调就像是让 AI 按照标准答案来学习,而新推出的偏好微调则更像是让 AI 理解用户更喜欢哪种回答方式。这种方法很适合那些没有标准答案、需要理解用户个人喜好的场景,比如写作风格的调整、对话语气的把握,以及创意内容的生成等。

  偏好微调成功案例:Rogo AI 正在开发一款面向金融分析师的 AI 助手,该助手能将复杂的查询任务拆分为子查询。在其专业基准 Rogo-Golden 的测试中,Rogo AI 发现,监督式微调 在处理非分布式查询扩展时表现不佳,例如在 “公司 X 的上涨的速度如何” 这类查询中,可能遗漏关键指标如 ARR。而通过偏好微调,这一问题得到一定效果解决,模型性能从基础模型的 75% 准确率 提升至 80%以上。

  偏好微调将于今日正式上线,并即将拓展至 gpt-4o-mini-2024-07-18。定价将与 监督式微调 保持一致,同时,明年初将支持OpenAI最新发布的模型版本。

  为了让更多开发者能够方便地使用 OpenAI 的 AI 服务,OpenAI 正式对外发布了 Go 语言和 Java 语言的官方开发工具包(SDK)测试版。这两个新成员的加入,与已有的 Python、Node.js 和版本一起,让开发的人能用自己最熟悉的编程语言来开发 AI 应用。

  1、全新的 Go SDK 专对于高性能场景设计。Go 语言在处理并发任务时表现出色,很适合构建需要快速响应的在线服务。通过这一个 SDK,开发的人能轻松地在他们的 Go 项目中添加 AI 功能,无需复杂的配置过程。

  2、Java SDK 的发布则是对企业开发者的重要支持。众所周知,Java 在企业级应用开发中占了重要地位,拥有庞大的用户群体和丰富的技术生态。新发布的 Java SDK 不仅提供了完整的类型支持,还包含了许多实用工具,能够在一定程度上帮助开发者更好地将 AI 能力整合到现有的企业系统中。

  这次 SDK 的发布意味着,不管是构建高性能的网络服务,还是开发企业级应用,开发者都能找到最对自己最合适的工具,轻松地将 OpenAI 的先进 AI 能力融入到自己的项目中。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  原上海庄行欧洲工业园区党支部书记、管委会主任黄纪章被查!涉嫌严重违纪违法

  鸿蒙 HarmonyOS NEXT 5.0.0.130 版本更多细节曝光

  苹果升级 Siri 的前奏:iOS 18.4 Beta 2 精细化快捷指令操作

  2025年县域普通高中“特色化多样化”内涵发展研讨会在华师上实成功召开