唐淼成 发布的文章
- 作者: 唐淼成
- 时间:
- 分类:
- 评论
本文主要介绍了如何使用 Python 读取文件并将数据提交到 MySQL 数据库中。文中提供了文件读取和 MySQL 调用的相关代码,包括如何判断字段是否存在、插入数据、更新数据以及提交事务等操作。
ItemStudy 新增利用大语言模型判断,因之前语义判断有问题且不能用 ReverseItem 作判断,现调用大语言模型判断 item 对语义是否相反,将语义相反的 item 对 similarity 取负。在特定模型下选取两端测试,正 correlation 区在现有样例中全部维持原判,负 correlation 区误判率约 0.325。此方法不能很好解决负 correlation 问题,需进一步研究。
文章介绍了在 ItemStudy 中添加了 reverse item 但仍为非线性,给出了相关链接和代码更新。提到对 xy 轴 pivot 尝试非线性相关,展示了 reverse 前后的结果图片。讨论认为区别不大,参数略变,绝对值大相关高,可能是语义“范围”问题,相似度高但相关性负很多的例子中套话结构占空间,被测变量内在相关性也有影响,还指出 item 的 reverse 是对被测变量而言的方向,并非语义方向。
- 作者: 唐淼成
- 时间:
- 分类:
- 评论
本文通过计算语义相似度和项目相关性,并进行回归分析,发现两者存在显著正相关。作者使用网上收集的 Cattell 16 种人格因素测试的数据进行了初步测试,后续还将处理其他数据集并进行合并。
- 作者: 唐淼成
- 时间:
- 分类:
- 评论
使用 Python 调用 OpenAI 库计算 Embedding,为后续设计 item 合并算法作实践基础准备,并通过计算余弦相似度判断字符串的相似性。
- « 前一页
- 1
- ...
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- ...
- 15
- 后一页 »