关键字的外表积
1.tf-idf核心理念演算法
1.1、tf(加减)
关键字在网页中再次呈现的频度
tf=关键字再次呈现的单次/该文的总词数
1.2、idf(英文所含逆文件格局振幅)
关键字再次呈现在大部分文件格局里的一类统计数据子集
idf=log(记忆术的文件格局数目/包容专有名词的文件格局数+1)
1.3、总括
假定A关键字在B网页中再次呈现了10次,因而大部分的文件格局记忆术1万个网页,A关键字在腾讯搜索结论页中再次呈现100亿次
tf=10/B网页的总词数
idf=log(1亿/100万+1)
1.4、tf-idf=tf*idf
2.关键字的外表积
2.1、表述
关键字在网页再次呈现的总字符串数与整座网页的总字符串数的比率,凡是是比率
两个简化字占三个字符串
式子:关键字外表积=凡是而言最末目的关键字的字符串数*再次呈现的单次/网页文档总字符串数
2.2、外表积提议值:2%-8%
2.3、促进感化:提拔联系关系性,避免行政惩罚
3.关键字外表积强化
3.1、确认关键字外表积的值
用辅助东西查阅关键字的外表积
预测前10合作者关键字外表积
3.2、批改网页关键字的外表积
主页:从F财产规划考量批改关键字的外表积
head地域:TDK起码再次呈现一场关键字
body地域、导航系统、股文档、文本文档、alt特征、a条码的title特征
电视频道页、跟主页批改形式那样、该文副题目加进关键字
文档页、该文副题目加关键字、该文的头尾段加关键字、alt特征加关键字
3.3、查验他们网页关键字的外表积
少激增减
3.4、TDK批改提议
推论与否有需要性批改
万万别频密批改,难削减阅读器的亲善性

评论列表