有一段时间没用Kimi手机版,今天打开看了看,发现还迭代了很多小功能,大模型能力慢慢场景化。
首先,在这新春佳节之际,增加了年度报告,还挺有意思,虽然是传统app玩过的套路,但总结出来的文字应该会更个性化吧。
【技术】个性化生成文字的能力。
kimi给我生成的年度总结
kimi给我生成的年度总结
然后增加了打电话功能,其实就是文字输入输出换成了语音输入输出,特别的,还加入“英语陪练”和“模拟面试”两个场景,能力场景化,技术服务应用。同时,另一个重要的转变,是用户输入输出习惯的转变。从最开始的手写字画到手动敲打键盘或是触摸板,用户做了一次转变和适应,现在在转变到语音输入输出,也需要同样的适应过程,毕竟很多思路在点击鼠标和键盘过程中产生,转到语音,总会有所遗忘或是无法持续扩展。但这肯定是不久的未来的趋势。
【技术】语音识别能力、大模型生成文字能力、文字转换成语音的能力。
kimi打电话功能
最后是拍照解题,尝试了鸡兔同笼的小学数据题,通过拍照上传的方式输入题目,kimi给出解题过程和答案,而且准确。这解决了很多家长辅导作业的困难,不需再手敲问题,一个拍照就解决。其实都是很常见的技术,但融合起来,就是很好的应用场景。
【技术】OCR能力、推理能力、生成文字能力。
拍照解题功能
当然,还有翻译、写作这两个小功能,支持用户更个性化、更便捷地输入内容,再返回对应信息。比如翻译功能,可以选择待翻译的语种(中文、英语或自动检测),也可以选择翻译后的语种(中文、英语、日语、法语)。
翻译功能
比如写作,可以选择文章类型是文章、作文、论文、故事、宣传文案还是工作总结,文章要求可以选写作风格、长度以及语言。
写作功能
大模型能力应用场景化,对AI产品经理,在工作上有极好的启发,也是其重要的必修课。
【一个小目标】91/365,关注行业关注趋势,多看多想多反思,做一个讲故事的人,讲一个好故事。