中文短文本聚合模型研究

消耗积分:3 | 格式:rar | 大小:2.96 MB | 2017-12-25

分享资料个

　　摘中文短文本聚合的目的是将两个数据集中属于同一对象的短文本信息进行匹配关联，同时要避免匹配不属于同一对象的短文本信息，这项研究对于多源异构的短文本数据资源整合具有重要的理论和现实意义．提出了一种有效的中文短文本聚合模型，通过快速匹配和精细匹配两个关键步骤可以大幅度降低匹配的候选对数量，并保证匹配的精度．针对传统短文本相似度算法的不足，提出了一种新颖的广义Jaro-Winkler相似度算法，并从理论上分析了该算法的参数特性．通过对不同数据集上的商户信息数据进行聚合实验，结果表明，新算法与传统算法相比，在匹配准确率和稳定性上具有最优的性能。

聚合

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

UC3842/3/4/5电源管理芯片中文手册
2024-12-02 16次下载

下载
DMT0660数字万用表产品说明书
2024-12-03 13次下载

下载
STM32F101x8/STM32F101xB手册
2024-12-06 8次下载

下载
华瑞昇CR216芯片数字万用表规格书附原理图及校正流程方法
2024-12-03 8次下载

下载
TPS54202H降压转换器评估模块用户指南
2024-12-04 8次下载

下载
HY12P65/HY12P66数字万用表芯片规格书
2024-12-03 6次下载

下载

中文短文本聚合模型研究

40篇英语短文教你精通3500个单词

基于注意力机制的新闻文本分类模型

面向搜索的微博短文本语义建模方法综述

文本挖掘之概率主题模型综述

基于深度学习的文本主题模型研究综述

基于评分矩阵与评论文本的深度学习模型

基于LSTM的表示学习-文本分类模型

基于BGRU的中文文本情感分析方法

基于词嵌入与神经网络的文本匹配模型

面向微博热点话题的改进BBTM模型

面向短文本的中文真词错误检测与修复

面向短文本的中文真词错误检测与修复

基于语义感知的中文短文本摘要生成技术

基于不同神经网络的文本分类方法研究对比

融合内容与多特征计算的个性化微博推荐模型

基于BERT的中文科技NLP预训练模型

融合文本分类和摘要的多任务学习摘要模型

基于BERT+Bo-LSTM+Attention的病历短文分类模型

一种基于BERT模型的社交电商文本分类算法

胶囊网络在短文本多种意图识别的应用及研究

基于多层CNN和注意力机制的文本摘要模型

基于双编码器网络结构的CGAtten-GRU模型

基于BP神经网络分类器的垃圾文本过滤模型

自然语言处理的图像文本建模相关研究及分析

一种针对中英混合文本的多维度多情感分析方法

基于主题模型和变分自编器的自适应知识方法

一种基于神经网络的短文本分类模型

基于神经网络的中文文本蕴含识别模型

结合BERT模型的中文文本分类算法

基于加权核非负矩阵分解的短文本聚类算法的资料说明

如何使用狄利克雷多项分配模型进行多源文本主题挖掘模型

如何优化自然语言处理模型的性能

AI大模型的最新研究进展

NVIDIA文本嵌入模型NV-Embed的精度基准

单日获客成本超20万，国产大模型开卷200万字以上的长文本处理

字节跳动辟谣推出中文版Sora 期待国产Sora大模型

亚马逊发布史上最大文本转语音模型BASE TTS

港中文贾佳亚团队联手MIT发布超长文本扩展技术，打破LLM遗忘魔咒

Meta发布一款可以使用文本提示生成代码的大型语言模型Code Llama

对话文本数据是培养大模型的智能与交流之源

对话文本数据的珍贵贡献：训练大模型赋予智能与情感理解

大型模型的重要基石与洞察力之源之文本数据

基于文本到图像模型的可控文本到视频生成

Meta开源文本如何生成音乐大模型

大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息

ELMER: 高效强大的非自回归预训练文本生成模型

一种「个性化」的文本到图像扩散模型 DreamBooth

摘要模型理解或捕获输入文本的要点

基于文本驱动的三维模型风格化方法

给一个文本提示就能生成3D模型！

快速了解文本语义相似度领域的研究脉络和进展

几种基于深度学习的中文纠错模型

受控文本生成模型的一般架构及故事生成任务等方面的具体应用

全球人工智能技术创新大赛短文本语义匹配方案技巧

知乎搜索中文本相关性和知识蒸馏的工作实践

OpenAI发布根据文字生成图像的人工智能系统

textCNN论文与原理——短文本分类

NLP中文自然语言处理数据集、平台和工具整理

运用多种机器学习方法比较短文本分类处理过程与结果差别

如何使用TensorFlow Hub文本模块构建一个模型，以根据相关描述预测电影类型

如何使用EAST文本检测器在自然场景下检测文本

下载排行榜

UC3842/3/4/5电源管理芯片中文手册

DMT0660数字万用表产品说明书

STM32F101x8/STM32F101xB手册

华瑞昇CR216芯片数字万用表规格书附原理图及校正流程方法

TPS54202H降压转换器评估模块用户指南

HY12P65/HY12P66数字万用表芯片规格书