资讯 更多 >>
商家花10万请人直播带货 结果3个月...
国内油价将迎来下调:国际原油跌破9...
国家能源局:今年以来我国煤炭生产...
河南4名阳性人员私自返乡并瞒报情况...
山西吕梁:发现盗采矿产资源行为可举报
受害方律师:接法院通知,乐安命案...
橙色——“柑橘院士”邓秀新心中最...
刷视频相认的双胞胎姐妹:两次创业...
四川通报2021年秋冬季首批大气污染...
首轮筛查:天津73443人全部阴性!
动态更多 >>
世界速递!LangKit:首个专为 LLM...
下午5点!巴西媒体做出争议报道,中...
【世界独家】回购或增持非托底股价...
警惕机票退改签有陷阱!包头一市民...
复星商业集团荣获2022年度城市商业...
新型支架治疗肺动脉分支狭窄安全有...
信达证券发布贝斯特研报 贝斯特点...
一箭41星!中国航天发射一箭多星纪...
设计时速350公里!沪宁沿江高铁开始...
今日播报!祝贺!我国成功发射一箭41...
会展 更多 >>
美籍酿酒师在崇礼:中国是第二故乡...
河南项城报告2名疑似新冠肺炎病例 ...
浙江绍兴确诊病例首次零新增 上虞...
广西东兴实行全员居家隔离 启动口...
新疆全方位推进乡村振兴 “富春山...
云南瑞丽市主城区全员核酸检测结果...
内蒙古满洲里累计治愈出院本土确诊...
孙海洋夫妻驱车山东阳谷:还在为孙...
大国工匠追梦“玉米强国”40载:用...
让南海“海洋热带雨林”斑斓多彩
专题报道 
当前位置: 动态 > >> 正文
 
世界速递!LangKit:首个专为 LLM 构建的监控解决方案
来源:OSCHINA     时间:2023-06-15 18:40:53


【资料图】

初创公司 WhyLabs 宣布推出LangKi,一个大语言模型 (LLM) 的可观察性和安全标准。LangKit 能够检测开源和专有 LLM 中的风险和安全问题,包括有毒语言、越狱、敏感数据泄露和幻觉。

根据介绍,LangKit 的一个核心卖点是它能够检测所谓的 AI 幻觉;还可以检测有毒的 AI 输出,以及发现模型可能不小心从其训练数据集中泄漏敏感业务信息的情况。LangKit 中的另一组监控功能侧重于帮助公司跟踪模型的可用性。WhyLabs 方面称,该工具包可以监控 AI 响应与用户问题的相关性,并且可以评估这些响应的可读性。

LangKit 使组织能够:

验证和保护个别提示和响应:检测提示或回应是否符合政策,并采取纠正措施。 评估 LLM 行为是否符合政策:根据一组黄金提示跟踪 LLM 的性能,以检测行为变化或违反政策的情况 监控 LLM 驱动的应用程序内的用户交互:监控提示、响应和用户交互,以便对整体用户体验的下降发出警报 跨不同的 LLM 和提示版本进行比较和 A/B 测试:确保对 LLM API 的更改不会导致客户体验下降

具体来说,由于 LangKit 是开源的,有高级需求的用户可以通过添加自定义监控指标来扩展它。用户可以将 LangKit 配置为在出现某些类型的技术问题时生成警报。该软件还将其收集的错误信息以图表的形式可视化,管理员可以查阅图表以确定语言模型的准确性是否会随着时间的推移而下降,这种现象称为 AI drift。

使用该工具包,软件团队可以在代码更改之前和之后立即将一组测试提示输入到模型中。通过比较 AI 生成的响应,开发人员可以确定更新是提高了还是无意中降低了响应质量。

更多详情可查看官方博客。

关键词:

热门推荐
猜你喜欢