収+@wxb22収權偅影視、小哾跕:拜登锁定2024年美国总统选举民主党总统候选人提名

来源:央视新闻 | 2024-03-14 04:21:22
彩秀网 | 2024-03-14 04:21:22
原标题:"収+@wxb22収權偅影視、小哾跕"
"収+@wxb22収權偅影視、小哾跕",正在加载

"収+@wxb22収權偅影視、小哾跕",拜登锁定2024年美国总统选举民主党总统候选人提名,“低彩礼可第一顺位择校”,缘何引发争议?



"収+@wxb22収權偅影視、小哾跕",菲律宾和美国里应外合,正在制造南海"黑洞",媒体:新开源低价定增被否实控人市价增持也可加强控制

"収+@wxb22収權偅影視、小哾跕",住不进的研究生宿舍

少妇小莹的yin荡生活下视频?

乳色吐息无删减片

在厨房和妈妈激战2

三分之一情人

热情的邻居床戏有几段

高压监狱5在线原声满天星

漂亮妈妈3未删减版免费观看



収+@wxb22収權偅影視、小哾跕:负债高!马斯克称美国将很快破产:必须停止过度开支,区块链概念股上涨集体上涨:PayPal涨超5%,Coinbase涨超4%,一波音客机据称因技术问题空中急降致数十人受伤

"収+@wxb22収權偅影視、小哾跕",心理测量在精神健康、自我了解、和个人发展方面都发挥着重要的作用。传统的心理测量范式以自我报告类型的问卷为主,常常通过参与者回忆自己的日常生活行为模式或情绪状态进行测量。这样的测量方式虽然高效便捷,但可能引发参与者的抗拒心理,降低被测意愿。随着大语言模型(LLM)的发展,很多研究发现LLM能够展现出稳定的人格特质,模仿人类细微的情绪与认知模式,还能辅助各种各样的社会科学仿真实验,为教育心理学、社会心理学、文化心理学、临床心理学、心理咨询等诸多心理学研究领域,提供了新的研究思路。近日,清华大学的研究团队基于大语言模型的多智能体系统,提出一种创新性的心理测量范式。与传统自我报告问卷不同的是,该研究为每位参与者定制化生成一个可交互的叙事类型游戏,用户可自定义游戏的类型与主题。随着游戏剧情的发展,参与者需要以第一人称视角,选择不同的决策行为,决定剧情的走向。通过分析参与者在游戏关键情节中的选择,该研究可以测量其对应的心理特质。△自我报告问卷的心理学测量范式(左)与交互叙事类游戏的心理测量范式(右)对比该研究的贡献主要体现在三个方面:提出一种新的心理学测量范式,将传统问卷转化成基于游戏的交互测量;在保证心理测量信度和效度的基础上,提升参与者的沉浸感,改善被测体验。为了实现游戏化的测量,该研究提出一种基于大语言模型的多智能体交互框架,名为PsychoGAT?(PsychologicalGameAgenTs),确保了心理学测试场景的泛化性,与不同游戏设置下测量的鲁棒性。通过自动化仿真评估与真人评估,在MBTI人格测试,PHQ-9抑郁测量,认知思维陷阱测试等任务上,该研究在心理测量学统计学指标和用户体验感指标上均展现出了显著的优越性。接下来,我们一起来看看该研究的细节。PsychoGAT长啥样?△PsychoGAT框架示意图智能体交互流程:给定一个传统的心理学测试问卷,参与者自定义游戏类型和主题,然后由游戏设计师(GameDesigner)智能体给出整体的游戏设计大纲。然后,游戏管理员(GameController)智能体生成一个具体的游戏情节,在这个过程中评论员(Critic)智能体会对管理员生成内容进行多轮的审核与优化;优化完成后的游戏情节会被展现给参与者,参与者做出相应的选择后,管理员基于此选择推动剧情发展,按照这样的交互过程循环。各智能体职能详述:游戏设计师(GameDesigner):利用CoT技术,生成第一人称叙事游戏的大纲,并保证这个故事线中所包含的情景,能够使得参与者表现出当前测量的心理特质。与此同时,将标准的心理学自我报告问卷,根据当前游戏故事线进行改编,使两者的融合更为自然流畅。游戏管理员(GameController):将改编后的问卷,按照游戏的故事线,依次进行实例化,变成故事的情节节点,并提供可能的选项,供参与者进行选择。与此同时,游戏管理员将参与者的选择返回给游戏环境,并基于参与者的选择,控制游戏的剧情走向。为了实现游戏情节的连贯性,管理员智能体采用“记忆更新”机制。评论员(Critic):旨在对游戏管理员的生成内容进行审核与优化。主要针对以下三个问题:1)优化一致性:随着游戏剧情推进,长文本问题会变得更加严重,使得“记忆更新”机制也无法完全保证情节一致性。2)确保无偏性:参与者的选择会影响游戏情节的发展,但在参与者不做出选择之前,管理员不应该预设情节走向,即便之前的选择中参与者体现出了明显的倾向性。3)改正漏缺项:对管理员生成的游戏情节进行细节审核,检查其是否具备基础的游戏沉浸感。实验及结果△三种常见心理学测量范式的对比:传统问卷,心理学家会谈,以及该研究提出的游戏化测评。此处提到的均为基于AI的自动化测量,特别的,心理学家会谈,指目前与大语言模型结合的,由大语言模型扮演心理学家的会谈范式。实验阶段,研究人员选择了三个常见的心理学测量任务:MBTI人格测试中的外倾性,PHQ-9抑郁检测,以及CBT疗法中前期的认知扭曲检测。首先,研究人员和成熟的传统心理学问卷进行对比,旨在检验该研究的心理测量信度和效度。进一步,和其他三种自动化测量方法进行对比,检验不同测量方法的用户体验。研究人员首先使用GPT-4模拟被测者,在不同的测量方法上记录测量过程与测量结果。这些测量记录被用于计算后续心理测量学信效度指标,以及用户体验感指标。评价指标有两个:信效度指标和用户体验感指标。信效度指标:心理测量学上,评价一个测量工具是否具有科学性,一般从信度(reliability)和效度(validity)两个维度进行验证。在该研究中,信度的指标选择了两个统计学量来衡量内部一致性:Cronbach’sAlpha和Guttman’sLambda6;效度的指标采用皮尔森系数,分别衡量聚合效度(convergentvalidity)和区分效度?(discriminantvalidity)。用户体验感指标,人工评估的指标包括:1)一致性(Coherence,CH):内容逻辑是否连贯;2)交互性(Interactivity,IA):是否对用户的选择有恰当且无偏的回应;3)趣味性(Interest,INT):测量过程是否有趣;4)沉浸感(Immersion,IM):测量过程是否让参与者沉浸代入;5)满意度(Satisfaction,ST):整体测量过程的满意度。下面是实验结果。首先研究人员检验了该研究提出的PsychoGAT能够作为一个合格的心理学测量工具,结果如下表所示。△PsychoGAT的信效度检验结果(+通过,++良好,+++优秀)进一步,研究人员对比了不同心理测量范式的用户体验感,该研究提出的游戏化测评在交互性、趣味性和沉浸感上都显著优于其他方法:△PsychoGAT的用户体验感结果,以及其他对比方法的相应结果为了确保人工评估的有效性,研究人员计算了人工评估结果,在PsychoGAT各指标优于其他方法上的评估一致性:△PsychoGAT的用户体验感指标由于对比方法在人工评估上的一致性为了对PsychoGAT做进一步分析,研究人员首先检验了不同游戏场景下,游戏化测量的信效度具有很好的鲁棒性:△PsychoGAT在不同游戏场景下测量信效度的鲁棒性接着,探究了每一个智能体在PsychoGAT中发挥的作用:△PsychoGAT不同智能体的作用最后,为了直观呈现PsychoGAT的游戏生成内容,研究人员用词云可视化了人格外倾性测试和抑郁测试:△PsychoGAT在外倾性测量和抑郁测量的游戏场景生成可视化。外倾性测试的内容主要集中在社交场景,而抑郁测试倾向于个人思维和情绪。更多研究细节,可参考原论文。论文链接:https://arxiv.org/abs/2402.12326广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

"収+@wxb22収權偅影視、小哾跕",  原标题:中新(西兰)两军举行第11次战略对话  5月10日,中新(西兰)两军在西安举行第11次战略对话。双方围绕共同关心的国际和地区问题坦诚交换意见,表达了共同致力于推动两军交流合作的积极意愿,增进了相互了解和信任。关键字:--**--  原标题:中新(西兰)两军举行第11次战略对话  5月10日,中新(西兰)两军在西安举行第11次战略对话。双方围绕共同关心的国际和地区问题坦诚交换意见,表达了共同致力于推动两军交流合作的积极意愿,增进了相互了解和信任。关键字:

"収+@wxb22収權偅影視、小哾跕",
作者:竺锐立



一男子在珠宝店抢劫后逃离,杭州警方通报

"収+@wxb22収權偅影視、小哾跕",拜登锁定2024年美国总统选举民主党总统候选人提名,邮轮股上涨嘉年华邮轮涨超3%,台湾空军学校大一新生旅馆内离奇身亡屋内传出烟味,美尼米兹号航母重回南海引猜测,专家:为军演看场子,中非找到中国公民遇袭事件的凶手,外交部回应:严惩

"収+@wxb22収權偅影視、小哾跕",洛天依龚琳娜唱响非遗民族音乐《歌行四方》

"収+@wxb22収權偅影視、小哾跕",
总监制:孟志杰

监 制:盘柏言

主 编:柴谷云

编 审:邛冰雯

(文章未经授权不得转载。)

点击收起全文
扫一扫 分享到微信
|
返回顶部
最新推荐
正在阅读:収+@wxb22収權偅影視、小哾跕:拜登锁定2024年美国总统选举民主党总统候选人提名
扫一扫 分享到微信
手机看
扫一扫 手机继续看
A- A+