《大数据》2024年第5期目次&摘要
来源:大数据期刊
《大数据》
第10卷第5期 2024年9月
大数据2024年第5期
-
郑纬民
-
沈晨晨,岳盛斌,刘书隽,周宇轩,王思远,陈伟,萧尧,李秉轩,宋鋆,沈晓宇,
-
黄萱菁,魏忠钰
03 PeMeBench:中文儿科医疗问答基准测试方法
张芊, 陈攀峰, 冯林坤, 刘淑钰, 马丹, 陈梅, 李晖
04 门控变关系图卷积网络的涉烟案件当事人预警
冯鹏程,张高豪,谢刚
05 情感语音合成综述
- 施昊翔, 张旭龙, 王健宗, 程宁, 肖京
06 数字说话人脸生成技术综述
张冰源, 张旭龙, 王健宗, 程宁, 肖京
07 面向抑郁症行为特征的领域词典构建
周若彤, 朱广丽, 李书羽, 段文杰, 李嘉伟
- 王艳, 刘亚东, 皮婵娟, 施君豪
09 基于数字政府建设的公文标签体系构建与应用研究
金加和, 施筱玲, 徐峰, 叶红叶, 俞巍滔
10 公共数据的产权运行机制与技术方案
郑宇
11 智慧治理中的数据质量管理困境及对策研究
秦之湄, 张会平, 王斌, 周婧超, 陈祎, 钟书丽
12 大语言模型数据隐私保护的难点与探索
施敏, 杨海军
战略研究
分布式技术在大模型训练和推理中的应用
作者:郑纬民
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024056&lang=zh
专栏:数据与算力驱动的应用
面向法律领域的大模型微调与应用
作者:沈晨晨,岳盛斌,刘书隽,周宇轩,王思远,陈伟,萧尧,李秉轩,宋鋆,沈晓宇,黄萱菁,魏忠钰
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024057&lang=zh
PeMeBench:中文儿科医疗问答基准测试方法
作者:张芊, 陈攀峰, 冯林坤, 刘淑钰, 马丹, 陈梅, 李晖
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024058&lang=zh
门控变关系图卷积网络的涉烟案件当事人预警
作者:冯鹏程, 张高豪, 谢刚
摘要:为了落实“精准监管”方针,烟草公司需要提高涉烟案件命中率。过往的方法缺少了对涉烟案件高危当事人的研究,阻碍了案件命中率的提高。基于烟草公司存有的大量历史数据,挖掘出准确的预警名单是提高案件命中率的有效途径。进行高危当事人特征分析后,提出门控变关系图卷积网络,以得到准确的高危当事人预警名单。首先,门控变关系图卷积网络使用变关系图卷积网络,捕捉当事人的关系与关键特征。然后,门控层进一步提取特征。最后,把特征输入Softmax层得到分类结果,进而得到预警名单。通过对比实验,证明构建的模型效果更佳。某市专卖局应用本项目的系列成果后,其案件命中率从约0.01%提升到了约0.5%,这证明构建的预警模型能满足真实监管的需求。
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024040&lang=zh
研究
情感语音合成综述
作者:施昊翔, 张旭龙, 王健宗, 程宁, 肖京
摘要:作为语音领域一个重要的研究方向,语音合成致力于将文本转化为语音。随着深度学习技术的快速发展,语音合成的目的早已不仅仅是合成一段“能听懂”的音频这么简单,情感的加入往往能使语音变得更加具有表现力。基于此,情感语音合成在语音中加入不同的情感并对情感进行调控,以生成灵活且准确的情感语音。从情感语音合成中的几个关键科学问题出发,分别对近几年来基于情感迁移、情感强度控制和情绪混合的发展进行了总结分析,并介绍了情感语音合成的相关数据集和评价指标,最后对情感语音合成进行了展望。
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024014&lang=zh
数字说话人脸生成技术综述
作者:张冰源, 张旭龙, 王健宗, 程宁, 肖京
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024059&lang=zh
面向抑郁症行为特征的领域词典构建
作者:周若彤, 朱广丽, 李书羽, 段文杰, 李嘉伟
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024009&lang=zh
一种融合注意力机制的CNN-BiGRU磁盘故障预测方法研究
作者:王艳, 刘亚东, 皮婵娟, 施君豪
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024060&lang=zh
应用
基于数字政府建设的公文标签体系构建与应用研究
作者:金加和, 施筱玲, 徐峰, 叶红叶, 俞巍滔
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024061&lang=zh
论坛
公共数据的产权运行机制与技术方案
作者:郑宇
摘要:公共数据的要素化既有迫切需求和巨大价值,又具备良好基础和实施保障。为了实现公共数据的要素化,数据要素智能构建技术与公共数据产权运行机制需要协同创新和融合发展。梳理了公共数据的分类和参与主体,提出一套公共数据产权运行机制,包括公共数据产权结构性分置制度、公共数据确权授权机制和个人信息授权机制,并搭建一套数字化系统来承载该机制,以建立健全数据要素各参与方的合法权益,促进公共数据在政府各部门、各层级、各主体之间的安全、合规、有序流通。
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024055&lang=zh
智慧治理中的数据质量管理困境及对策研究
作者:秦之湄, 张会平, 王斌, 周婧超, 陈祎, 钟书丽
摘要:数据质量是实施智慧治理的基础。从数据使用者的视角出发,以D市智慧治理项目为案例,基于多渠道收集的资料,剖析数据质量管理的困境及其产生的原因,并提出相应对策。研究发现,智慧治理项目中数据质量管理困境表现为管理制度机制不健全、数据质量评价指标不适配以及协同中信息传递不畅通。困境产生的原因是项目建设中质量管理要求特殊性、数据资源可用程度难以匹配使用需求以及理念惯性下质量管理共识难以支撑管理执行。突破困境的关键是,提高质量管理理念共识化程度,增强质量评价方法动态化能力以及优化数据协同策略精细化粒度。
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024005&lang=zh
大语言模型数据隐私保护的难点与探索
作者:施敏, 杨海军
摘要:基于海量数据训练的大语言模型在带来通用人工智能可能性的同时,也给数据隐私保护带来了新的风险与挑战。在分析大语言模型全环节中涉及的数据隐私保护风险的基础上,对隐私保护中知情同意原则、数据收集“正当、必要”原则所面临的新伦理难点展开分析论证,并探索可能的解决框架和路径,以及实操中仍可能存在的伦理难点。
原文链接:http://www.j-bigdataresearch.com.cn/thesisDetails#10.11959/j.issn.2096-0271.2024033&lang=zh
免责声明:本号所载内容均为原创、投稿、授权转载或网络公开资料搜集整理,仅供读者交流学习使用,版权归原作者所有,且仅代表作者个人观点,与本号立场无关。若所引用的图片、数据、文字等来源标注有误或涉及侵权,烦请及时联系删除。