登录
LIKONE 观点

Sora 文生视频开年王炸,下个十年的产品涌现

LIKONE
2024-02-18

图片

OpenAI 官网

01

AI 届的三连炸:

Gemini 是个炸弹,Sora是王炸

近日,AI届迎来多个重大模型更新。Google放大招推出下一代模型 Gemini 1.5,其具有100万token的上下文理解能力,是目前最强!具有跨模态理解和推理:能够对文本、代码、图像、音频和视频进行高度复杂的理解和推理。允许分析1小时视频、11小时音频、超过30,000行代码或超过700,000字的文本。

在Google发布Gemini Pro 1.5的2小时后 OpenAI 紧接着发布了Sora。Google 认为Gemini Pro 1.5是个炸弹,结果OpenAI直接出了王炸 😂 水花刚起来,就被摁下去了!

Sora 可以根据文字提示生成长达 60 秒的高清视频而且视频能包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。非常牛P!

图片

我经常说,搞产品的要明白,OpenAI体系化背后的武器库库存积累很多,对手只要一有大动静他就能拿出来一个王炸。

图片

当大家还在沉浸在 OpenAI Sora 的兴奋时,看看我们国人的行动力。羡慕人家这种赚钱能力,就是学不会 😮‍💨 😮‍💨 😮‍💨

图片

与此同时,RPA 届也迎来一个炸弹级的研究成果。构建通用智能体框架的OS-Copilot,也将震撼一众 RPA 从业者。

OS-Copilot 能够与操作系统(OS)进行交互,完成一系列广泛且复杂的计算机任务的智能代理框架。它能够自我学习和改进,处理各种操作系统级别的任务。该项目由上海AI实验室、华东师范大学、普林斯顿大学和香港大学的研究人员共同开发。

图片

OS-Copilot 为 Linux 和 MacOS 提供了一个通用接口,整合了常见的操作系统操控实践,如Python代码解释器、bash终端、鼠标/键盘控制和API调用。研究人员基于OS-Copilot框架创建了一个垂直应用或具象化代理:FRIDAY

图片

FRIDAY与操作系统配合可以:

  • 自动化日常任务:比如设置工作环境、自动整理文件、备份数据等。

  • 数据处理与分析:在像Excel这样的应用程序中自动执行计算、生成图表等。

  • 多媒体内容创建:比如自动在PowerPoint中创建演示文稿或编辑视频。

  • 网页浏览和信息检索:自动化网页搜索,快速汇总和收集特定信息。

  • 编程和脚本执行:自动生成代码片段或执行特定脚本来完成任务。

  • 第三方应用交互:与邮件客户端、日历、社交媒体等第三方应用程序进行交互,执行如发送邮件、更新事件等任务。

  • 自我学习和改进:通过自我指导学习新技能和应用,不断提升其执行任务的效率和准确度。

02

下个十年的产品涌现:

软件功能的生成趋势即将加速

我们已经无法想象,在开始做一个新产品或者功能,完全一行行代码堆的场景。然而,随着AI原生时代的到来,这种场景正在发生根本性的变化。未来,我们将看到软件功能的生成趋势加速,并且将不再依赖于手工编码的方式。
AI 原生的时代,会变成一个个服务堆,一个个开源模型堆,我们不再需要自己实现这些服务和模型,而是可以直接使用它们。不可能自己实现这些服务和模型。这个趋势只会不断加速,区别是之前,还能一点点理解自己使用的这些项目或技术框架、架构和工作原理,现在已经不可能了。到了 AI 时代,就更加明显,都不晓得它怎么工作的,反正就是工作了。因为现实问题非常复杂,而且还在快速变化,功能性应用永远不可能满足未来的需求。
生成式 AI 的出现将使软件数据工艺发生巨大变革,软件功能的交互方式也将会发生革命性的变化。各类基于Pipeline(流水线)式的自动化将会由 AI Agent 来处理,它融合了自动化的思想和人类操作的过程。这样看来 RPA 型的自动化仅仅是个 Windows CE (过渡),正如一句话说的:不是让机器人打算盘。都已经有 AI 了,人类可以问 AI 直接要结果和建议,而不是通过功能自动化来完成低效的工作。
在适应AI原生时代产品环境的过程中,提供屏蔽底层架构的统一智能核心将成为关键。这种升级将实现从数据驱动到智能驱动的转变,并结合生成式AI,实现超级自动化。在不久的将来,我们将看到此类叠加应用的爆发式增长。
正如NVIDIA的黄仁勋在2017年所说,AI正在吞噬软件,这一论断至今仍然成立。现在的问题是,AI将如何改变不同领域的软件,在我们自己的行业,就是 AI 将如何改变数据与智能应用市场。AI不是炒作,而是正在以相当快的速度改变着这个世界。因此,我们都必须积极跟进并适应这一变革,而不是置身事外。

03

回到 LIKONE 这个项目,

我们在哪里,要到哪里去?

LIKONE项目于七年前启动,最初的功能和架构在第二年基本完成。然而,到了第三年,团队出现了分歧:一部分成员主张继续拓展垂直领域的功能,而另一部分则认为已经增加了过多华而不实的功能,而忽视了底层技术的重要性。
然而,我们必须意识到客户要的从来不仅仅只是技术,而是技术背后的产品设计、服务保障以及可持续的创新能力。我们所有人都需要深刻理解客户为何愿意付费,为什么愿意付我们这么多钱,而不是单纯展示技术的强大。底层技术突破很难也固然重要,但往往在产品上,真正赚钱的不是最高深的技术,我们只需要提升一些用户体验,改变一些工艺流程,只要能够帮助用户节省人力、成本,提升效率,客户都是愿意付费的——每个技术点,都要设计价值主张给到客户,而不是只是说技术很厉害,必须得到客户的认可。因此,我们需要更多深入客户现场,更多去理解客户的实际需求、痛点、痒点。
在强调“用户体验”时,我们需要意识到,不仅包括 GUI、运维、命令行、导入导出、文档等方面,甚至包括我们个人的形象、态度、沟通和专业能力等等,对客户来说,都是一种“体验”。领先的产品理念和极致的用户体验是战胜客户自主开发的唯一办法,而不是依赖于黑科技或者厉害的算法,要做到让客户彻底放弃自研的念头,而不是激起他们深入研究技术实现的冲动!
此外,我们必须认识到,仪表盘或者报表、大屏统计从来不是客户要的最终结果,他们要的是基于数据的管理能力。因此,未来设计智能应用的思维方式将发生改变。为客户提供一站式智能驱动的应用是未来非专业客户的迫切需求也是我们跨越鸿沟的核心要点。也就是说,现在上层的智能应用都值得重新做一遍。这是不是得投入巨大?并不是。我们大概一周能搞定一个智能应用,还包括文档和测试用例。因为这些功能,都不需要自己从头到尾发明新轮子,直接对接现有的套件服务、开发工具或者其他开源项目就可以。
这次 AI 革命,能够让其余 85-90% 的人直接消费数据或者智能产品,AI 能带来的,将远比这些更多,我们在实践中实现了几个方向,已经产生了巨大的变化和影响。可以预见,现有的架构是无法满足的。这里的变革才刚开始,我们的实践走在行业最前沿。
做这个事,肯定不会只有 LIKONE 一个项目,今后一定会出现更多类似的项目,提供屏蔽底层架构的统一智能核心,实现应用的智能驱动。因此,我们需要跳出技术思维,打出差异化和壁垒,提升技术投入的 ROI,并快速占据市场,以适应这个新的发展趋势。

图片

长按识别,访问我们正在建设中的行业智能应用商店

随时随地获取最新 LIKONE 观点
订阅
领先一步
智能业务加速
即刻咨询,开启您的智能化生产力跨越之旅
商务
咨询
添加 LIKONE 顾问
享受一站式客户服务
长按将二维码保存为图片
售前
电话
电话热线
400-917-9517
复制号码
取消