中国电商精英会张学宁电商培训怎么样
2021/08/11

SEO内容堆砌时代 TF-IDF(词频-逆文档频率)算法是一种统计方法,用以评估一字词对于一个文件集或一个

语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着

它在语料库中出现的频率成反比下降。该算法在数据挖掘、文本处理和信息检索等领域得到了广泛的应用,

如从一篇文章中找到它的关键词。 TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,

并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TF-IDF实际上

就是 TF*IDF,其中 TF(Term Frequency),表示词条在文章Document 中出现的频率;IDF(Inverse Docum

ent Frequency)。 其主要思想就是,如果包含某个词 Word的文档越少,则这个词的区分度就越大,也就是 

IDF 越大。对于如何获取一篇文章的关键词,我们可以计算这边文章出现的所有名词的 TF-IDF,TF-IDF越

大,则说明这个名词对这篇文章的区分度就越高,取 TF-IDF 值较大的几个词,就可以当做这篇文章的关键

词。SEOSEO 基于TF-IDF算法衍生出来的内容堆砌时代,在这个时期盛行各种伪原创工具,堆积关键词密

度,站长之家的密度建议2%至8%被誉为行业标准,还有四处一词(标题title、关键词keywords和描述descr

iption、内容、锚文本)的运用,让SEOer们在搜索引起中如鱼得水。 SEO外链时代: PageRank,网页排名

,又称网页级别、Google左侧排名或佩奇排名,是一种由根据网页之间相互的超链接计算的技术,而作为网

页排名的要素之一,以Google创办人拉里·佩奇(Larry Page)之姓来命名。