科技之家

科技之家,汇聚专业声音 解析IT潮流

首页 > 创业 >

搭载GPT-4o 这款智能眼镜能否重塑学习体验?

来源:互联网 时间:2024-07-04 16:55:15

  AI终端越来越多了,轻量级的智能眼镜也卷起来了。

  继Ray-Ban Meta之后,solos公司宣布推出了一款新型智能眼镜,名为AirGo Vision,它功能多样,并集合了OpenAI提供的ChatGPT-4o,还兼容 Google Gemini 和 Anthropic Claude 大模型。可以说,这款眼镜集合了最强的AI大模型。

  用户可以借助语音命令来回答任何疑问或提供实时输入,例如阅读外语广告牌或获取城市路线帮助等,这是智能眼镜的一大特点。

  与笨重的AR头显相比,智能眼镜更显轻巧,其外形与普通眼镜没有区别,关键在于可以在紧凑的镜框内置入AI技术。

  从本质上来看,智能眼镜并非是AR眼镜,它没有眼镜屏幕,但它将成为搜索信息的视觉延伸,并带来多样化的互动功能。而这样的特性,正适合教育场景,学习是在生活中自然发生的。

  AirGo Vision眼镜的出现,让智能眼镜领域更加热闹,这意味着智能眼镜将更快进入大众的日常生活。

  01 搭载大模型,可语音、可识别、可拍照

  从功能上看,佩戴者可以解放双手拍摄照片并即时查询信息。solos还提供了将主镜架换成没有前置摄像头的副镜架的选项。

  与其他智能眼镜不同,这款眼镜的摄像头镜头嵌入在镜腿中,而不是镜架中。这种替换在更正式的场合非常有用。

  AirGo Visio集成了耳机,可以用来收听应用程序。为了让佩戴者知道任何重要的通知或电话,镜架上有闪烁的 LED 指示灯。

  这款眼镜利用人工智能技术还可以用来描述当前视野中的物体,图像识别可以提供有关该物体的有用信息。这使得用户可以立即了解产品的价格,并查询该商品是否在其他地方更便宜。

  根据solos介绍,这款眼镜还应该能够掌握更复杂的任务,例如指导用户进行烹饪或其他手工活动,以及提供转弯导航等特性。

  AirGo Vision的镜片不仅用于图像识别,还可以用来拍照,但没有显示屏。照片可以在App内进行查看。

  总体来看,solos提到:

  人工智能 AirGo Vision 可根据视觉输入提供实时信息,识别人物和物体(“我在看什么?”);

  或导航和叙述方向或地标(“告诉我去埃菲尔铁塔的路线”),而不需要再打开手机;

  借助免提操作和便利性,用户还可以不用手拍摄照片,这对于烹饪、家装项目、教育和学习甚至购物等活动的视觉进展和下一步行动特别方便(“我在看什么,它多少钱?其他地方有更优惠的价格吗?”);

  人工智能还可以总结这些活动,以增强组织和协助。

  AirGo Vision的价格为249美元,本月开始发售。这个价格指的是没有摄像头的基础型号,其功能非常有限。目前尚不清楚具有全套功能的摄像头版本的定价是多少。

  这不是solos第一次推出智能眼镜。

  早在2024年CES上solos推出了带有ChatGPT的Solos AirGo3智能眼镜。Solos AirGo3 使用音频让用户与ChatGPT交谈,而AirGo Vision眼镜则可让用户通过视觉输入搜索信息。

  根据以往solos推出的眼镜,对于近视眼或者远视眼用户可以配置处方镜片,相信AirGo Vision也不例外。

  根据solos® 官网显示,solos® 是 Kopin Corporation 旗下的一家纳米技术公司,目标是以人为本发明全球最先进的智能眼镜技术。solos工程师大多来自麻省理工学院,他们热衷于开发创新技术,通过语音提取技术、清晰的音频和多样化的风格来增强用户体验。

  02 有望成为新的学习方式

  随着大模型的出现,智能眼镜成为趋势之一,已经吸引多家选手入局。

  此前,Meta与雷朋合作,已经推出了Ray-Ban Meta智能眼镜,用户只需一句"Hey Meta"这样的语音指令,即可激活智能助手,从而体验到Llama大模型的AI能力。能看,能听,能拍照,还能录像。

  根据Meta数据,2023年Q4.Ray-Ban Meta的出货量超过30万副,Meta称,Ray-Ban Meta的市场表现远超预期。到现在,The Verge预测,这款产品的销量可能已经突破100万副。

  OPPO也加入了这一潮流,其于2024年世界移动通信大会(MWC 2024)期间发布全新一代辅助现实智能眼镜OPPO Air Glass 3概念产品,该产品的亮点是希望实现跨端协同,如通过OPPO Air Glass 3在手机端的专属APP调动OPPO自主研发的AI大模型AndesGPT,用户只需触碰镜腿,即可体验语音助手功能。

OPPO Air Glass 3概念产品

  在Google I/O 2024开发者大会上,谷歌也提到,将配合新一代Gemini模型做一款智能眼镜,它能够实现实时识别生活中的场景、物品,并通过AI识别、搜索、信息整合后反馈给用户,给出智能化的建议。但是,目前该产品还没有上市。

  可以说, 搭载大模型的智能眼镜兼具娱乐、学习、生活助手、工作助手等多种功能。

  教育方面,可以实时翻译,也可以作为一个语言对练的工具。在博物馆,扫描文物后,可以给出个性化的讲解,且由于内置大模型,可以让AI从不同角度来解析。

  从本质上来看,智能眼镜是一个新的智能终端。与XR头显相比,智能眼镜的外形跟普通眼镜相比相差无几,不需要有很长的适应期。智能眼镜也可以迭代为AR眼镜,或许只是时间的问题。

  智能眼镜面临的挑战几乎是人工智能落地的挑战,比如,可靠性和准确性。不过,随着技术的进步,这些问题或许会解决。

  未来,智能眼镜有望成为一种新的学习方式。

相关文章