聊聊OpenAI最新发布的GPT 4o-数据库专区

聊聊OpenAI最新发布的GPT 4o

作者：一个数据人的自留地数据人创作者联盟编辑：任朝阳 2024-05-21 10:56 IT168网站原创

　　01 为什么叫4o

　　GPT-4o，其中 "o" 代表 "omni"，即全能之意。它不仅在文本处理上达到了前所未有的水平，更在图像和语音处理方面取得了重大突破。GPT-4o 能够实时对音频、视觉和文本进行推理，提供与人类相似的响应时间，这在 AI 领域是一个巨大的进步。

　　GPT-4o是迈向更自然人机交互的一步，它可以接受文本、音频和图像三者组合作为输入，并生成文本、音频和图像的任意组合输出，“与现有模型相比，GPT-4o在图像和音频理解方面尤其出色。”

　　02 GPT 4o带来了什么

　　这里面，重点突出的就是多模态和实时的能力，它不仅提升了 AI 技术的上限，也为未来的研究方向和应用场景提供了新的思路。类似于人类生活中的场景，其实就是一个多模态场景，比如你在和家人聊天时，你不仅要用语言来表达，你的眼睛也会观察获取信息，是一个典型的多模态场景。

　　无论是最初的 GPT-3.5，还是去年这个时候的 GPT-4，还是去年底的 GPTs，又或者是今年年初的 Sora——OpenAI 再一次证明，它不会让世人失望。尽管 Google、Claude、Character AI、Perplexity 等竞争对手正攫走更多新用户、以及资本的青睐，但 OpenAI 依然证明自己有能力引领着科技创新的「高地」。不得不说，ChartGPT不断在拔高人们对大模型的期待，但是，最后的应用情况，还有待观察，也要看实际的落地情况。

　　拍了张小米汽车照片，让GPT识别下

　　03 大模型未来会怎样

　　发展业界流行了一个词，叫PMF。在新技术和产品的落地过程中，要寻找与市场的最佳契合（PMF），即产品、目标市场和商业模型的精准结合。有很多创业者在初期其实难以清晰定义自己的产品、明确目标客户群，以及如何将两者有效融合。所以大部分都是拿着锤子找钉子，最后发现落地上困难重重，不能解决应用场景中用户的实际问题。

　　虽然目前大模型技术进步提供了前所未有的机遇，但也伴随着诸如技术稳定性不足、市场需求认识不清等问题。特别地，面向消费者（To C）的创业可能面临更大的挑战，包括对人性的理解和运营能力的要求，但是国内很多创业公司都不会放弃To C市场，而且会优先和大力投入做To C市场。而当前阶段面向企业客户（To B）的创业路径其实是更为可行的选择，尤其是在初期需要MVP应用和尝试的时候，可以优先做一些辅助工作流程的copilot，也要分清楚你是解决一个痒点还是痛点的问题。

　　最后，依然对人工智能的发展坚定的充满信心，也希望大家可以多关注、应用和实践。期待未来能够找到PMF，早日出现杀手级的应用！

关注我们