七龙珠,现在只集齐了六颗,还需要一颗才能召唤神龙
作者:Jian Shuo Wang 发表于:2023-05-11 15:21 · 未分类
预测未来是什么样很难。但是预测未来不是什么很容易。
我确信的知道的,是未来的 LUI 的世界中最重要的技术,还没有浮出水面。
动画片里面集齐七颗龙珠可以召唤神龙,现在 ChatGPT 这样的 LLM 一定是其中非常重要的一颗龙珠,但是一定还有一颗特别重要的龙珠没有出现,以至于我们哈需要一段时间才能召唤神龙。
手机在 2G 的时代,马上就要进入 3G 的时候,大约是 2004 年吧,那个时候我作为一个移动互联网的坚定的乐观派,相信移动一定是未来。但是看看手里那一个多普达,用着那塑料的按键和小小的屏幕,却总觉得不能昧着良心说,这个体验比 PC 更好吧。

对于移动互联网应该是怎样,业界至少讨论了 5 年,直到 2007 年 iPhone 诞生。原来,移动互联网除了手机的算力,除了 3G,还缺少一个我们大多数人完全没有意识到的东西,就是多点触控触摸屏。乔布斯用惊人的想象力把这最后的一颗龙珠凑齐了,才召唤到了 iPhone 这条神龙。
对于大语言模型开启的自然语言交互界面(LUI)的世界,我每次想象的时候,总有一团浓雾遮挡在那里,让我看不清楚未来的具体的产品形态。
到底未来人和机器如何交互?是依然用键盘聊天吗?还是用语音?一定有一些我们现在并没有给予足够重视的技术,加在一起,才能把七颗龙珠集齐。
这一颗龙珠是什么呢?
如果一定让我来猜,我会把 AR 当作最可能的候选项。Google Glass 的想法,当时或许是集齐了其他的所有元素,但是就缺一个更加自然的交互方式。Google Glass 中最难解决的是输入问题。如果大语言模型解决了输入,眼镜投屏技术解决了输出,或许就是一款新的划时代的产品。毕竟,iPhone 之前有苹果的 Newton,也有其他公司的 Palm 作为先烈,Google Glass 作为未来的一个真正划时代的 AR 设备的先烈也是有可能的。
当然,我唯一知道的是,我现在的一切猜测,一定是错误的。
注:照片中是我在 2004 年 1 月用自己的 Dell 电脑上的摄像头,通过 Windows Media Encoder 和 Windows Media Server 发布视频流,并且通过基于 Windows Embeded 的多普达手机和 GPRS 上网,查看视频流的一个实验。这就是十几年以后的「直播」。这也再一次说明了,技术的可能到社会的应用,动辄就是 10 年。(具体的步骤和设备可以点击「阅读原文」看19 年前的实验记录)