凉宫春日是谷川流创作的《凉宫春日系列》轻小说及其衍生作品的女主角,设定为高中生。虽然项目名字里只有「凉宫春日」,但「Chat 凉宫春日」可以模仿的人物达到了 32 个,包括李云龙(《亮剑》男主角)、哈利・波特、张牧之(电影《让子弹飞》男主角)、Sheldon(美剧《生活大爆炸》男主角)等等。在聊天时,这个模型不仅可以模仿这些人物的语气、个性,还能充分结合剧情。
「Chat凉宫春日」是由李鲁鲁、冷子昂、陈启源发起的Luotuo(骆驼)的子项目之一,在魔搭社区主办的Create@AI黑客马拉松大赛中获得二等奖(top3)。我们可以在B站上看到他们的项目介绍视频。
视频链接:https://www.bilibili.com/video/BV1Xh411A7kC/?vd_source=12c1d661b492e88e254fc63d0a861962
技术报告链接:https://arxiv.org/pdf/2308.09597.pdf
GitHub 链接:https://github.com/LC1332/Chat-Haruhi-Suzumiya
<img src="https://www.huajuwang.com/src/115.jpg" alt="
500 Internal Server Error
nginx
” />
数据集链接:https://huggingface.co/datasets/silk-road/ChatHaruhi-54K-Role-Playing-Dialogue
本项目采用 Apache 2.0 协议,也就是说,你可以利用项目中的代码进行商用。但是你仍然需要遵守以下事项:1. 角色本身的版权方的协议;2. 项目中使用的接口方,比如 OpenAI 的协议;3. 项目中使用的模型的协议(比如如果后期采用了 LlaMA 或者 GLM 的模型。)
以下是项目的大体内容。
让 AI 扮演特定角色有一定难度
用 AI 模型进行角色扮演在游戏、创意产业等许多领域具有潜在的应用前景。
在开源角色扮演的实现中,开发者或用户已经采用了类似的 Prompt,将它们持续输入到 ChatGPT 或者作为 system whisper 接入到语言模型中:
I want you to act like from . I want you to respond and answer like using the tone, manner and vocabulary would use. Do not write any explanations. Only answer like . You must know all of the knowledge of . My first sentence is "Hi ."
因为 ChatGPT 或 Claude 在训练的时候已经阅读过很多故事,再加上更大的语言模型所表现的「智能」行为。用户们发现模型往往能在这样的 prompt 下表现出一定的角色扮演能力。然而,这样的实现虽然简单,却有以下缺点:
<img src="https://www.huajuwang.com/src/126.jpg" alt="
500 Internal Server Error
nginx
” />
这样的 prompt 使用高度依赖大语言模型本来的记忆。如果大语言模型对于角色的记忆本身是模糊的,则无法模仿特定的角色。
这里的「know all of the knowledge of 」的定义也是模糊的,无法很好地防御大语言模型幻觉效应的产生。
即使是使用这样的 prompt,聊天机器人的对话风格还是会很大程度受到语言模型的影响,调整 prompt 或许能够缓解这样的问题,但是每一个特定的角色都要非常精细地调整 prompt。
这些缺点明显限制了这种角色扮演聊天机器人的使用。
模拟特定角色的大体思路
第一,知识与背景:每个虚拟人物都有自己所处在的背景,比如凉宫春日处在一个日本的高中里。所以 ChatBot 需要了解对应故事的设定。这对于大型语言模型的记忆能力是较大的考验,需要通过外部知识库的引入去解决。
完整的开发计划如下图所示:
<img src="https://www.huajuwang.com/src/117.jpg" alt="
500 Internal Server Error
nginx
” />
项目的主要贡献可以概括为以下几点:
3、为了检验和比较不同方式形成的角色扮演 ChatBot 的性能,他们使用自动测评和人工测评两个方式对角色扮演机器人进行了测评(部分测评结果还未公布)。在自动测评中,他们测试角色是否能够对剧本中的经典的剧情进行响应,给出和原剧本近似的回答。在人工测评中,他们提出了两个不同的指标,让被试去评估两个不同的指标:吻合度:机器人的回答是否符合角色的原来设定;回答质量:机器人的回答的语言质量是否较好。结果发现,在使用同样的基础语言模型的情况下,他们的算法可以给出更好的角色扮演的性能。
下图是「Chat 凉宫春日」的核心对话系统示意图,包含 system prompt、为用户查询 q 检索到的角色记忆 D (q, R) 以及规划历史 H。
下图是项目数据集中涉及的角色数据列表:
用户评论
孤廖
哎呀,这个500 Internal Server Error真是让人头大啊,我刚想点进去看看,结果就遇到这种情况。nginx的问题,希望尽快解决。
有20位网友表示赞同!
ok绷遮不住我颓废的伤あ
500 Internal Server Error,这可是个老对手了。每次遇到这个错误,我都得重新刷新页面,真的很影响体验。
有18位网友表示赞同!
一尾流莺
nginx出问题了?这可是个关键的服务器软件啊。希望尽快修复,不然我们这些使用者可要受苦了。
有16位网友表示赞同!
三年约
500 Internal Server Error,我每次遇到这个错误都怀疑自己的网络,现在才知道原来是服务器的问题。希望尽快解决,不然我都不敢点开了。
有13位网友表示赞同!
蝶恋花╮
这500 Internal Server Error真是让人崩溃,我刚想分享点东西,结果就遇到这种情况。希望管理员能快点修复。
有19位网友表示赞同!
烟雨萌萌
nginx出问题了,我猜是配置出了问题。希望开发团队能快速定位并解决问题。
有17位网友表示赞同!
一别经年
500 Internal Server Error,我猜是服务器过载了。希望管理员能增加服务器资源,提高稳定性。
有8位网友表示赞同!
墨染殇雪
遇到500 Internal Server Error真的很头疼,每次都要重试好几次。希望服务器能更稳定一些。
有16位网友表示赞同!
全网暗恋者
这500 Internal Server Error让我想起了上次遇到的情况,真是让人无奈。希望管理员能提高服务器的响应速度。
有5位网友表示赞同!
别在我面前犯贱
500 Internal Server Error,这让我想起了曾经的网络问题。希望这次能快点解决,不要影响我们的使用。
有16位网友表示赞同!
花海
nginx出问题了,我猜是代码有问题。希望开发团队能尽快修复。
有19位网友表示赞同!
莫阑珊
500 Internal Server Error,每次遇到这个错误我都觉得是自己的问题。现在才知道原来是服务器的锅,希望尽快修复。
有5位网友表示赞同!
相知相惜
这500 Internal Server Error让我怀疑人生了,真是让人抓狂。希望管理员能提高服务器稳定性,不要让用户受罪。
有11位网友表示赞同!
箜篌引
nginx的问题,希望管理员能重视起来,不要让这个错误再发生。
有20位网友表示赞同!
苍白的笑〃
500 Internal Server Error,每次遇到都让人心情不好。希望管理员能提高服务器的性能,减少这种错误的发生。
有8位网友表示赞同!
经典的对白
这500 Internal Server Error让我想起了之前的网络问题,希望这次能有所改进。
有17位网友表示赞同!
毒舌妖后
nginx出问题了,希望开发团队能尽快解决,不要影响我们的使用。
有5位网友表示赞同!
不忘初心
500 Internal Server Error,每次遇到都让人头疼。希望管理员能提高服务器的稳定性,减少这种错误的发生。
有11位网友表示赞同!
花开丶若相惜
遇到500 Internal Server Error真的很让人沮丧,希望管理员能尽快修复,让我们的体验更好。
有9位网友表示赞同!