关于数据挖掘技术在图书选题策划中的应用研究
发布时间:22-06-17 点击次数:131
摘要:近年来,在新媒体高速发展的同时,大数据出版与出版业务也进行了深入融合,在这种技术发展背景下,以往图书出版所应用的模式已经不能与当前高速发展的行业需求相匹配,滞后性很强。因而,为了可以让图书选题策划开展得更加顺利,应该强化对数据挖掘技术的利用,深入挖掘图书市场信息以及读者的消费信息,科学对选题进行分析,了解出版信息资源,保证可以为出版决策提供精准依据,让出版服务水平不断提升,进而促进出版行业的可持续发展。
关键词:数据挖掘技术;图书选题策划;应用
 
一、数据挖掘技术在图书选题策划中应用的必要性
(一)对出版发行机构精准了解消费市场需求很有利
近年来,图书出版形式逐渐呈现出多样化的特点,内容也越来越专业,甚至已经有了各类专业相互整合的趋势。因此,在实际发展期间,除了要熟练掌握专业的知识之外,还要对行业的新发展形势进行分析,深入地研究,确保可以掌握更多其他领域的知识和技能。同时,应该采取和时代发展需求相一致的方式对图书进行选题策划,严格对图书信息进行把关,坚持主流意识形态,深刻领会并宣传党和国家的方针政策,强化对先进技术手段和理念的应用。依托于这一背景,在图书主题策划中,可以强化应用数据挖掘技术,帮助出版机构编辑以及出版社发行人员等及时地对图书市场动态加以了解,快速地对社会中用户群体的阅读导向进行解读,从中获取有价值的信息,保证能有针对性地对出版发行的选题策划加以调整,让图书的出版更加精准科学,提高读书的营销效果。
(二)出版行业图书的选题优化很有利
科学地对数据挖掘技术加以利用,对图书出版结构选题策划能力的提升有很大促进作用,在该技术的支撑下,图书出版机构能在短时间内对市场的需求加以了解,明确读者的图书购买心理和趋势,掌握图书市场的热点,并以此为基础,有依据地对选题进行更新[1]。同时,对数据挖掘技术有效运用,还能让消费者群体的定位更加准确,从而做到优化企业输出,帮助出版发行机构对图书选题策划方面的问题加以改进,让以往出版发行机构编辑人员工作方式滞后、创新性不足等问题得以解决,从而提升图书选题的精准性。
(三)对出版盈利能力的提高很有利
依托于数据挖掘技术,在图书选题策划期间,可以将大数据分析的作用和价值充分展现出来,以便出版发行机构的销售量能整体提升,并强化对销售能力的改进。同时,借助数据挖掘技术,也可以让出版机构对营销图书的销售渠道、市场、读者等多方面信息有所了解,让图书出版机构能够精准对市场进行定位,了解当前市场的发展动态,明确出版物的营销特点。在该技术的应用下,出版发行机构能对以往图书库存积压严重、营销模式缺乏多元化等问题加以革新,有利于出版机构整体盈利能力的增强,对出版行业的可持续发展大有裨益[2]。科学且合理地对海量数据信息加以处理,也可以在一定程度上对出版机构的调研成本进行节省,确保出版机构可以从宏观的角度上对整个出版行业的发展方向加以把握,以此能在大环境中立足,摆脱以往出版方式暴露出来的各种弊端,让出版发行机构能制定更为长远的计划和目标,进而有效促进图书出版行业的转型升级。
二、数据挖掘技术在图书选题策划中的应用形式
对于数据挖掘技术来说,主要是对数据库中的有价值的信息进行深入挖掘。近年来,由于网络发展速度不断加快,信息也呈现出了膨胀趋势,特别是半结构化、非半结构化为主的文本信息,为信息的高效收集带来了很大难度。为了可以让信息得到合理利用,将其内在价值呈现出来,应该选择利用合理的方式处理,对其中所需要的信息加以提取,让信息以更简洁且更便利的方式展现。而在这种背景下,文本挖掘技术渐渐出现在人们的视野中。文本挖掘技术是数据挖技术中较为重要的部分,可以在海量的数据中提取出最有价值的信息。当前,网络技术水平的不断提升,再加上Web应用推广范围的不断扩大,网络信息也变得越来越多,类型日益复杂,而采取何种方式从这些大量、自由且非结构化的信息中获得所需要的知识,以往的数据挖掘技术已经不能满足实际需求。若想解决这一问题,必须科学地将传统的文本挖掘技术与Web衔接起来,深层次地对各类信息加以挖掘,以便所获得的信息数据更高效。需要明确的是,要在当前纷繁复杂的网络信息中,保证信息获取的真实性,还要借助挖掘技术,掌握更多信息,对生活和社会有深入的理解,侧重对智能化图书选题策划智能化模式的打造,以便图书出版效率以及质量能整体提升[3]
三、数据挖掘技术在图书选题策划中的应用对策
(一)信息收集以及预处理
在对信息进行收集和整合期间,应该坚持客观事实,对重点内容着重关注。从用户的角度分析,对简洁明了的信息结构越来越推崇,只需要几句话便可以将事件的起因和背景描述出来,了解整个事件可能造成的影响。因此,在借助数据挖掘技术对信息进行搜索期间,必须具备提炼整合的能力,能精准对基础信息进行辨别。现阶段,用户对图书的要求越来越高,传统单一的图书信息已经不能满足用户的个性化需求[4]。故而,在对图书选题策划方面,不仅要将娱乐性、客观性等特点凸显出来,还要将各个特点衔接起来,最终形成一个统一的整体。在传统数据库应用过程中,数据大多为完全结构化,而与之相比,数据挖掘技术则存在很大不同,其最大的特征便是半结构化。
从评论挖掘的层面分析,网页包含的信息种类相对较多,内容较为复杂,并非所有的信息都有一定价值。体现网页主题信息的是主题内容,与主题无关的广告信息等内容则是没有任何价值和意义的。因而,在对网页净化期间,需要将这些没有价值的内容清除掉,将网页中含有主题的内容保留下来。在借助数据挖掘技术对读者评论进行挖掘过程中,应该科学地对这些数据进行处理,将网页内容中的非文本信息清除干净,包括音频、视频等。当然,也可以对聚焦爬虫技术加以利用,精准地对目标信息进行抓取,确保所提取出来的信息能更加准确,实现持续提取信息的目的。需要明确的是:在对图书信息进行收集过程中,所包含的信息有书名、作者、出版机构等;读者信息则涵盖性别、年龄等;市场信息则包括销量以及排名等。
(二)图书特征提取以及情感分析
科学技术的发展对图书出版领域所产生的冲击非常大,所以为了能有效缓解这种局面,行业必须积极作出改变。在具体的图书选题策划过程中,要想保证数据挖掘技术应用得更加合理高效,除了要借助技术,科学地对信息进行收集和预处理之外,也要精准地对图书特征进行提取。通常情况下,评论内容属于中文语句,需要借助该技术将词语从中提取出来,以保证能获取读者关注的图书特征。在进行这一环节过程中,首先需要对中文分词技术加以利用,借助词性标注,将一个汉字序列切分为相互独立的词,并利用计算机对语句语义进行自动识别,从中提取出关键词。
通常而言,如果想要让一本图书顺利地出版,需要经历很多繁琐的流程,要完成多个环节的工作。并且,在这些复杂的流程中,还囊括了大量职业和工作人员,要身处不同职业和岗位的人共同参与,并在不断配合和协调中将与之相关的工作任务完成。因此,必须强化对先进技术手段的应用,树立团队意识,确保能顺利地将图书编辑中的问题彻底解决,让图书选题策划更加合理,进而顺利完成图书的出版。借助数据挖掘技术所挖掘出来的读者关注特征是读书评论中最集中及最热点的内容,但由于每项特征的评价倾向性不同,所以还需要深入地分析,科学地展开处理,精准对读者每项关注的特点加以了解,明确其所持有的褒贬态度,并对其评价情感倾向性加以剖析,以便所获得的数据内容能更加有价值[5]。对于这些修饰词来说,可以对原有的词汇情感倾向加以改变。因而,在对读者评论进行情感判断的过程中,必须深入对这些强度词语展开研究,了解其所展现出来的作用,以便所挖掘出来的信息能更加高效科学,进而为图书选题策划的合理性及可行性提供依据。
(三)借助信息完成选题策划
1.对正向评价图书特征科学筛选。在图书选题策划过程中,可以借助数据挖掘技术,科学地对读者关注特征进行挖掘,并在此基础上,筛选出其正向评价,以此来对市场中读者感兴趣的图书特征加以明确,确保可以为后续图书选题策划的确定提出依据。比如:假设以亚马逊图书网站作为研究对象,针对少儿图书栏目,对其中位列销售排行榜前两名的图书的读者评论信息进行挖掘,了解读者所关注的图书特点为绘画、价格等,之后对相关软件技术合理应用,有针对性地筛选出正向评价特点,如若筛选出的是拼音、习惯等,那么其特点则是图书选题策划中所需要着重考虑的因素。
2.科学构建图书选题策划概念层次树。在数据挖掘技术应用过程中,虽然已经明确正向评价的图书特点,但要想确定图书的题目,还需要对各个方面进行分析。在这些评价中,一部分要通过修改之后才能来做图书题目,而另一部分则需要在图书的装帧设计方面予以体现,包括拼音、价格等。因此,为保证数据挖掘技术应用得更加合理,应该在该技术的支撑下,有效对图书选题策划概念层次树加以构建。在具体的概念层次树构建期间,树状结构为其主要形式。在整个概念层次树中,具体可以分为两个分支,分别为选题内容设计和装帧设计,结合层次树的特点,设计人员在实际设计过程中,可以结合选题策划领域知识,并在综合自身水平及能力的前提下,科学地对层次树进行改进,适时地进行更新。
3.明确图书题目和装帧设计要素。在数据挖掘技术的应用下,对技术筛选出来的图书正向评价进行综合分析,了解其所展现出来的特点,并结合图书选题策划概念层次树,将题目以及装帧设计要素找出来,从而为图书选题策划提供依据。比如:依旧以亚马逊网站评论为例,在经过了一系列的筛选之后,依照正向特征,图书题目要素包括百科、动物、习惯等,而列为图书装帧设计的要素则有绘画、价格等。依托于这些要素,在对图书选题策划过程中,能够有更为精准且合理的信息数据作为支撑,更好地满足市场需求和标准。利用这一手段,也能准确识别出图书市场的发展方向,从中对选题内容进行判断,保证可以最大限度满足读者的心理期望值,可以依照其兴趣爱好来对图书进行选题和策划,确保可以提升图书选题策划的合理性,从根源对图书出版的风险予以降低。
结束语:
综合而言,在图书选题策划过程中,科学地对大数据挖掘技术加以利用,可以有效地对图书信息进行收集,合理地进行整理和分类,高效地对各类信息加以储存,深入挖掘其中有价值的数据,尤其是能在大数据量的情况下,精准地展开运算,挖掘精准度非常高,可以为选题策划提供数据支撑,有利于出版社更准确地了解市场以及读者信息,保证图书选题策划的合理性和科学性。因此,为促进出版行业的可持续发展,一定要加强对该技术的应用,并在了解当前行业发展现状的基础上,适当地对技术进行优化和改进,确保该技术的作用和价值的充分展现出来。
参考文献:
[1]栾锦骥.数据挖掘技术在图书选题策划中的应用研究[J].自动化技术与应用,2019,35(12):50-52.
[2]胡育峰.大数据在选题策划中的应用[J].出版参考,2019(30):17-18.
[3]朱建丽.浅谈大数据技术在图书出版中的应用[J].科技传播,2020,12(15):128-129.
[4]许海婷,姚丹阳.大数据出版在童书选题策划中的应用现状和对策思考[J].中国传媒科技,2021(07):111-113.
[5]王琪,姚永春.大数据时代图书选题策划的技术手段[J].编辑学刊,2019(05):76-79.

作者简介:秦琳(1981-),女,汉族,重庆人,副编审,硕士研究生,单位:四川民族出版社,研究方向:图书出版。

联系电话:029-81130634

投稿邮箱:qinzhibjb@126.com qinzhibjb@163.com

Copyright © 2021-2022 秦智杂志社 版权所有 Power by DedeCms |