01 为什么叫4o
GPT-4o,其中 "o" 代表 "omni",即全能之意。它不仅在文本处理上达到了前所未有的水平,更在图像和语音处理方面取得了重大突破。GPT-4o 能够实时对音频、视觉和文本进行推理,提供与人类相似的响应时间,这在 AI 领域是一个巨大的进步。
GPT-4o是迈向更自然人机交互的一步,它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,“与现有模型相比,GPT-4o在图像和音频理解方面尤其出色。”
02 GPT 4o带来了什么
这里面,重点突出的就是多模态和实时的能力,它不仅提升了 AI 技术的上限,也为未来的研究方向和应用场景提供了新的思路。类似于人类生活中的场景,其实就是一个多模态场景,比如你在和家人聊天时,你不仅要用语言来表达,你的眼睛也会观察获取信息,是一个典型的多模态场景。
无论是最初的 GPT-3.5,还是去年这个时候的 GPT-4,还是去年底的 GPTs,又或者是今年年初的 Sora——OpenAI 再一次证明,它不会让世人失望。尽管 Google、Claude、Character AI、Perplexity 等竞争对手正攫走更多新用户、以及资本的青睐,但 OpenAI 依然证明自己有能力引领着科技创新的「高地」。不得不说,ChartGPT不断在拔高人们对大模型的期待,但是,最后的应用情况,还有待观察,也要看实际的落地情况。
拍了张小米汽车照片,让GPT识别下
03 大模型未来会怎样
发展业界流行了一个词,叫PMF。在新技术和产品的落地过程中,要寻找与市场的最 佳契合(PMF),即产品、目标市场和商业模型的精准结合。有很多创业者在初期其实难以清晰定义自己的产品、明确目标客户群,以及如何将两者有效融合。所以大部分都是拿着锤子找钉子,最后发现落地上困难重重,不能解决应用场景中用户的实际问题。
虽然目前大模型技术进步提供了前所未有的机遇,但也伴随着诸如技术稳定性不足、市场需求认识不清等问题。特别地,面向消费者(To C)的创业可能面临更大的挑战,包括对人性的理解和运营能力的要求,但是国内很多创业公司都不会放弃To C市场,而且会优先和大力投入做To C市场。而当前阶段面向企业客户(To B)的创业路径其实是更为可行的选择,尤其是在初期需要MVP应用和尝试的时候,可以优先做一些辅助工作流程的copilot,也要分清楚你是解决一个痒点还是痛点的问题。
最后,依然对人工智能的发展坚定的充满信心,也希望大家可以多关注、应用和实践。期待未来能够找到PMF,早日出现杀手级的应用!