0


聆思大模型AI开发套件试玩评测

前言

    首先,这次的套件来自于极术社区的聆思大模型AI开发套件评测活动,很荣幸能够入选的40名开发者之一,本次帖子记录套件试玩的过程及测试。

套件介绍

    聆思大模型AI开发套件的主控芯片是CSK6011A高性能AI芯片,板载16MB的Flash和30W像素的摄像头模组以及扬声器麦克风,320*240的触碰显示屏幕,ESP32-C3 网络模组。

    快递到手后,里面包括了一个 CSK6-MIX开发套件 以及一根 Type—C 数据线。

    拿到的套件默认烧录了快速体验的固件,文档描述该固件三种示例功能,在使用功能之前,先使用串口助手(我是用的是UartAssist)

    用使用Type-C数据线连接开发板DAP_USE口,给模块配网,波特率为115200,*ASCII*码,配网指令如下。
wifi connect wifiname password

出现这个应该就是配网成功了,接下来开始初始固件的功能体验

1.大模型语音对话功能

2.大模型作画

3.大模型控制设备

    初步的使用体验下来还是不错的,在比较嘈杂的环境下待机没有出现误识别的情况,也能正确识别到唤醒词,进行正确的指令操作,偶然出现了一次想要作画识别,套件进行了设置屏幕颜色的操作。

环境搭建

我使用的是Windows系统进行环境安装

打开cmd,在命令行终端输入

git --version

检查是否git是否安装成功,出现版本号既安装成功

下载官网的CKS一键安装包,下载完成后右键管理员运行打开

选择路径(我这边改到了D盘),下一步,安装

安装成功后,在命令行终端中输入环境自检命令

lisa info zep

输入后终端会显示CSK6 开发环境的安装情况

lisa zep create

选择hello_world,回车进行创造

显示输入文件名,输入文件名

hello_world

终端显示创建sample,进入刚创建的路径,并编译

cd hello_world
lisa zep build -b csk6011a_nano

显示构建成功

接着使用Type-C数据线连接开发板DAP_USE口开始烧录,输入指令

lisa zep flash

出现结束,即代表烧录成功,完成环境的搭建。

性能测试

    主要通过运行速度,准确率部分对官方给予的示例进行综合的性能测评。

    首先是大模型自带的初始固件自带的三个功能测试。

对话功能

    由于只是对套件进行性能测试,所以没有对星火大模型的逻辑性,语言表达能力等进行深度测评,主要还是针对,测试总共进行了20次对话,从对话结束到套件回答的平均时间大约是六秒,准确率为百分之八十五,基本都能够符合能正确回答问出的问题。失败的三次中,一次是没有理解到意思(这次其实也不知道应不应该计入0.0),一次是误识别成屏幕颜色,另一次是提示稍等后没有给出回应(感觉是识别为作画但是没有画出来)。

作画功能

    作画功能也进行了20次的作画,作画的要求从简单到复杂,从画一辆赛车到后面的画出外星人在地球上包饺子之类的画,作画的平均时间大约是十秒,准确率为百分之八十,神奇的是,简单的要求作画反而有时画不出来,越测到后面复杂的要求反而是都能够回应且画出来。

屏幕颜色设置

    屏幕颜色设置,同样是20次的测试,这次平均的设置时间是五秒上下,准确率为百分之九十五,错误的一次是说设置成天空的颜色设置成了墨绿色,再次设置成天空的颜色又变成了蓝色。

坐姿检测

    进行坐姿检测的功能测试前先进行固件的烧录,将电脑和套件进行连接,在终端中输入

进行固件的烧录,其中COM改为自己的COM口。

lisa zep exec cskburn -s \\.\COM8 -C 6 -b 1500000 0x000000 spd_zephyr.bin

烧录完成后,对套件进行重新上电,将摄像头对准人像,套件即会对摄像头获取的图像进行手以及身体的角度分析,经过测试手的状态有正常,下垂,撑脸三种状态,身体状态有正常、趴桌、驼背、离席、倾斜五种状态,由于贴主的问题,无法对此功能进行测试,只能说响应速度很快,手的状态识别能够很准确,但是身体的驼背状态有时识别不出来,需要较大的幅度才识别为驼背。

单词评测

单词评测的烧录过程为

1.首先编译示例单词评测的工程,在终端输入

lisa zep build -b csk6_duomotai_devkit apps\lcd_csps\ -p

2.连接电脑与套件,将COM改为自己的COM口,继续输入烧录指令

lisa zep exec cskburn -s \\.\COM8 -C 6 -b 1500000 0x000000 --verify-all .\build\zephyr\zephyr.bin

烧录完之后,按下套件上的复位键RST进行使用,点击屏幕后进入选择界面,有单词,短语,句子三个选项,每个选项有三组题,单词的题库是happy,friend和jump;短语的题库是see you later, good morning和i love you;句子的题库是i am happy to see you,Good moring! How are you today和Let's jump and have fun。在相应的题的界面,点击评测,念出单词,再次点击结束,即可立刻显示精准度流畅度完整度标准度以及错误单词,每道题目我都进行了五次测评,三次正确念出,一次念错单词以及一次不读,都能够正确分辨出正确念出,错念或漏念的单词。

总结

    经过对聆思大模型AI的深入评测,我们得出了以下的结论。总体体验下来,首先是官方的技术文档结构清晰,易于理解。其次,聆思大模型AI给我们留下了非常深刻的印象,其高度的开发性和优秀的表现令人赞叹。聆思大模型AI在图像识别、语音识别等多个方面的表现都非常出色。无论是对于复杂的语义理解,还是对于细微的图像特征识别,聆思大模型AI都能提供即时、准确的反馈。

    以上就是鄙人试玩聆思大模型AI开发套件的内容了,感谢你能看到这里,希望这个帖子能帮助到你。

本文转载自: https://blog.csdn.net/weixin_52884834/article/details/135928362
版权归原作者 热爱学习的小华同学 所有, 如有侵权,请联系我们删除。

“聆思大模型AI开发套件试玩评测”的评论:

还没有评论