图片类网站 SEO 优化技巧分享

一个网站要在各大搜索引擎中位于前面的位置,需要对其 SEO 进行优化,搜索不同关键词下的搜索排名,从而获客。本文以图库网站为例,谈谈优化思路,希望对你有所启发。

本文是图片类 SEO 优化的优秀文章,转载于 图库网站 SEO(搜索引擎优化) 案例

背景

我司主营素材版权代理销售业务,包括图片、视频、音乐、字体,主要面向大 B 端客户。现为提高销售数据,需要从多方面入手完成网站产品优化,整体方向是 「开源节流」,即增加访问网站的用户量,同时提高关键路径上各个重要环节的转化率从而提高整体指标的数据表现。

通过对历史多年数据分析,60% 用户访问设备为 PC 端 Windows 系统,18% 来自于安卓,13% 来自于 Mac OS 。并对来源渠道进行分析,2022 年全年数据 43% 用户来源于 SEO(自然搜索流量),29% 来源于直接访问域名,24% 来自于 SEM 投放。

综上,想要进行开源,重点是从 SEO 、 SEM 着手 (直接访问域名多为老客户,指直接在浏览器输入域名后访问网站) 。而 SEM 投放的广告费用每年水涨船高,主要方向为投放策略的优化,在我其他文章中会有描述,这里不赘述。那么 SEO 是本文主要讨论的流量获取方式。

本文主要讲我们是如何在 1 年的时间内容,通过针对网站的 SEO 优化,提高网站在搜索引擎各关键词下的搜索排名从而获得流量、商机数量提升的,作为一种免费的流量获取方式,需要的同学感兴趣可以参考。

目标:

SEO 的目标是提高网站在各大搜索引擎中,搜索不同关键词下的搜索排名,从而获客。

一、 SEO 基本原理

SEO 本质上是优化网站结构、体验,让网站页面被搜索引擎爬虫更好的爬取、收录,同时借助搜索引擎的投票评分机制、用户体验检测机制获得一个很好的网站搜索引擎评分,从而在用户搜索某些关键词时自己的网站能够得到搜索引擎提供的不错排序位置,提高曝光量从而实现获客。

搜索引擎工作原理其实很简单,各大搜索引擎公司会定期/不定期的派出多个爬虫爬取互联网上的所有网站页面,对于符合标准,有收录价值的页面会进行收录 (一般除明显作弊网站、违法违规网站以外都会有所收录) 。并对收录的页面进行评分,在用户通过搜索引擎搜索相关内容时,搜索引擎根据命中的关键词返回相关页面给用户,返回结果的排序 (不考虑投放 SEM 广告情况下) 主要取决于被召回结果与用户搜索内容的关联度、被召回结果各自的评分权重。

二、关键词优化

做 SEO 最重要的一点莫过于关键词的优化,搜索引擎会根据页面中各关键词出现的频次、位置、重要程度给予评分,这个关键词将会用于与搜索引擎用户的搜索需求匹配。因此如何让你希望用户搜到的关键词正确、合适的出现在页面中,帮助页面在对应关键词下获得不错排名,是个非常重要的 SEO 工作。

首先堆词,要确保关键词与页面内容是匹配的,不能出现风马牛不相及的情况。

其次,页面中关键词是有重要层级的,例如从上至下,上方权重更高。 H1(标题) 标签内的内容权重比 p(段落) 标签内的高。

页面中核心关键词最好合理的多出现几次,注意,需要合理。因为搜索引擎经过多年的发展,是有一套反作弊的算法机制的,当发现页面中有恶意堆词的情况,可能会降低页面评分、不收录,甚至 Ban 掉整个域名。

以我们做图库网站为例,我们希望图片详情页被收录,同时我们希望用户在百度搜索 「图片」 时我们的页面有不错的排名。那么我们的标题可以从原来的 「一个女人」,经过代码逻辑拼装成 「一个女人的图片」 。而下方关键词,可以从人、女人、人类,扩展为:人图片、女人图片、人类图片。这样一方面保证关键词、标题和页面内容是匹配的,另一方面提高了图片这一主题在页面出现的频次,从而搜索引擎会判定这个页面是主要讲 「图片」 的。在搜索引擎的用户搜索 「图片」 时,可能我们的页面会有不错的权重。

三、元标签优化

元标签优化,又称为 TDK 优化。做过前端开发的同学可能比较清楚,或者你打开浏览器,点击 F12 或者开发者工具可以看到。我们所看到的网页是一堆 HTML 代码渲染得来的。 HTML 代码是用来描述页面的,正如一篇文章,HTML 中也有 Title(标题) 、 Description(描述) 、 Keyword(关键词) 三个关键的页面描述。

TDK 必须要简洁、精准的描述当前页面的主要内容,搜索引擎在收录页面时,会给到 TDK 中出现的内容极高的权重,就像你读一篇文章,往往是从文章的标题入手,文章的标题通常是文章的核心内容。

例如,我们图片详情页的 Title 可能是 「一个美丽模特的图片」,Description 可能是 「XXXX,正版图片购买」,而 Keyword 可能是 「图片,素材,正版图片,模特,美丽」 。

四、 URL 结构优化

页面的地址,也就是 URL 也是搜索引擎收录的重要内容。我们需要尽可能的保证 URL 层级明晰、简介,如果可以,尽量包含页面的关键词。

例如我们的首页 www.xxx.com,图片搜索页 (搜索关键词城市时) 是 www.xxx.com/image-search/chengshi,而图片详情页是 www.xxx.com/image/123513,是很明确的层级结构,可读性很强,并且包含了关键词或者图片 ID 。

五、网站导航和内链

搜索引擎给页面评分有一个很重要的机制,叫投票评分机制。比如 A 页面搜索引擎给到了很高的评分,而 A 页面中给到了超链接到 B 页面,那么搜索引擎会认为 「A 页面这么重要,都链到了 B 页面,那么 B 页面一定也很重要」 。而 A 页面、 C 页面、 D 页面…都链到了 B 页面,搜索引擎给到 B 页面的评分则会更高。

这就是为什么,很多网站会在不同文章、页面、栏目之间给到便捷的超链接。

而导航,则是方便爬虫爬取使用的。爬虫爬取页面有深度优先和广度优先两种形式。一种是在页面发现一个页面就往下爬,然后找到下级页面再往下,爬到一定深度再回到最初页面。广度优先呢,则是把一个页面所有链接都访问了,再往下一层爬取。但是两种方式都有一个特点,就是需要页面之间有链接,作为蜘蛛爬行的路径。而网页的导航则是最适合干这个事的。

因此需要非常清晰的导航设置,比如图片首页、视频首页、音乐首页等等,都在网站的大首页有明确的导航。

并且由于所有网站的首页权重都是最高的,所以尽可能的把想要被搜索引擎爬到、收录到的页面挂到首页。

我们的实现方式是在大首页,会放很多精选专题的推荐,精选图片的链接,用户下载最多的图片的展示和链接,最新上传入库的图片的展示和链接。通过首页给他们投票,而这些子页面之间又互相有链接互相投票的方式,达到提高相关页面搜索引擎评分和权重的目的。

六、外链

上文中所谓的投票逻辑,不仅是站内会有,站外到站内的外链也是一个重要的评分机制。例如 A 站搜索引擎权重更高,如果 A 站首页挂了 B 站的链接,会认为 B 站也是优质网站 (是在这一维度上给到较高评分) 。因此往往会有站长联盟,大家互相交换有价值的网站外链,互相投票从而提高 SEO 。

我们在实际 SEO 过程中没有进行这一项的优化,因为作为一个行业内头部的产品,在选择外链上会很谨慎,因此无法纯从 SEO 考虑出发去做友链交换。

七、速度优化

搜索引擎召回网站结果之后,实际会有逻辑去监控每个网站的打开率、跳出率。例如百度提供了免费的百度统计功能,相当于 0 埋点的页面数据统计,网站站长只需要在 HTML 的头部引入百度统计的代码,则可以方便统计站内用户的访问数据,免费相应的交换,就是每个页面的跳出率对方也就知道了。

搜索引擎监控网页的打开率,是指用户搜索关键词召回 10 个结果,更多的用户点击了其中的哪一个,则是搜索/点击转换率,即点击率。点击率较高,则认为网页和用户搜索词的相关度较高,会获得更好的排位。

而跳出率,则是搜索引擎判断一个网页用户体验的重要依据,如果跳出率 (用户打开之后,没有进行同域名下下个页面访问,直接关闭页面则算作挑出) 高,则一定程度上证明要么这个页面和搜索内容不符合,要么这个页面的体验特别差。如果跳出率高,搜索引擎会降低这个页面在对应关键词下的搜索权重评分,使排名下降。

另外一方面,搜索引擎的爬虫爬取页面时,也会评估页面的加载速度 (实际的渲染) 。按理说搜索引擎的爬虫不会像浏览器一样加载页面资源,因此不会直接测量页面的加载速度。但是搜索引擎有一些从侧面评估页面加载速度的方式方法,例如可以评估 HTML 下载时间、评估页面资源 (JS 、 HTML 、 CSS 、图片) 大小从而推测加载时间、一些内部测试页面加载速度的工具等。

简而言之,页面速度影响两个方面搜索引擎的工作。

一是搜索引擎的爬虫,爬取每个网站的时间往往是固定的,比如只给你 2 小时,2 小时爬到多少内容可能评估、收录多少内容,那么加载速度越快,被爬到、收录的到页面就会越多。

二是评估网站体验,如果网站体验较差,可能会降低网站的权重和收录可能。

在这方面,我们产品重点的工作从以下几方面入手:

  • 优化图片大小:网站中以图片为主要内容,搜索页、详情页都有很多的图片,这个是页面资源中加载耗时最长的内容。我们采取的做法是无论 jpg 还是 png,一律压缩成 webp 格式,大大缩小存储大小。 (由于部分浏览器版本不支持 webp 格式,需要在页面中通过 js 检测页面是否支持 webp 再决定本次浏览加载 jpg 还是 webp 图片)
  • 减少 HTTP 请求:尽量的减少页面中需要进行的 HTTP 请求数量。比如可以合并文件 (将多个 CSS 或则 JS 合并成一个单独文件) 、使用 CSS Sprites 将多个页面点缀元素合并到一个图像文件中、雅座资源 (压缩 CSS 、 JS) 、对于非常小的 JS 和 CSS 文件,进行 HTML 内联、尽量合理利用缓存。对于图片列表展示的区域,进行懒加载,即页面加载到特定部分才发出请求加载后面的图片内容
  • 非首屏延迟加载:非首屏的内容延迟加载,优先保证首屏的高速加载和展示
  • 精简代码:生产代码去除无用的代码、多余的注释

八、移动端优化

前文提到,20% 左右的流量来自于移动端。搜索引擎的桌面端和移动端权重是分开评分的。移动端有一套单独的评分标准。

由于移动端的网络、设备限制,移动端对于页面的大小、加载速度有更为严苛的评分标准。因此移动端优化主要是针对移动端,简化页面功能,更好的适配屏幕满足移动端的交互需求。

九、创建站点地图

爬虫会来网站爬取、收录,但是光被动等着肯定是不合适的,把整个网站上所有主要、次要页面收录制作成站点地图然后提交给搜索引擎,是一个非常高效的方式。

首先确定好网站结构,例如我们产品有首页、二级首页、搜索页、详情页、专题页,这些页面是主要的内容呈现页面。然后通过站点地图生成工具,生成 XML 形式的站点地图。到百度、 Google 等搜索引擎的站长工具中提交制作好的站点地图。

站点地图需要定期的更新,尤其是如果有新的页面增加、旧的页面删除,都需要及时更新。大量页面突发性的删除变成 404,如果没有主动上报,被搜索引擎发现,会被视为非常严重的情况,搜索引擎会降低对站点的信任,导致降权。

对于删除页面,我们主要做了以下的措施:

  • 设置自定义 404 页面,提供有用的信息和导航链接,帮助用户找到想要的内容
  • 对一些有逻辑可以跳转的页面,进行有效准确的 301 重定向
  • 更新网站地图上报到搜索引擎
  • 定期检查网站中的死链接,进行修复或者清理

十、落地页优化

在页面被收录之后,其实重要的工作有两个点:

  1. 如何留住进站用户
  2. 如何定向提高某些想要的关键词的排名

本质上,都是需要对落地页 (进站后访问的第一个页面) 进行优化。落地页需要有符合用户预期的高质量内容,同时还通过相关图片、相关专题推荐的形式,去扩展用户的浏览边界,让用户沉浸的持续的在站内各页面流转。

想要针对性的提高某些关键词排名,除了上文说到的在单页面堆词以外,我们的措施是将相同主体的图片归纳成一个专题,在专题中展示标题、主题包含相同内容的图片,从而形成聚合页面。内容聚合页面无论是对关键词的提权,还是对用户的扩展阅读,都非常有帮助。

而人工长期的建立专题始终是效率有瓶颈的,因此我们开发了一系列可以直接设定主题,完成高质量内容聚合构建专题的自动专题抓取系统,一天一个人即可轻松创建几十上百个专题页面。

十一、优化结果数据

从我们开始 SEO 工作,到现在近 1 年时间。我们从同行业搜索引擎权重排名垫底 (百度权 3 左右) 到现在基本同行业权重第一 (百度权 7 、百度移动权 8) 。收录页面数量 2500 万,PC 收录关键词 25000 个,移动关键词收录 24000 个,其中前 3 名关键词 PC230 个,移动端 800 个。

SEO 渠道访问用户数 (2023 年 1 月至 11 月) 同比 (2022 年 1 月至 11 月) 提高 124%,全渠道流量同比提高 56%,商机线索数量提高 42% 。基本达到预期目标,后面应该不会有大动,因为后期发现,SEO 前期提高会有明显效用,但是后期持续扩张会带来一些问题,以后有时间可以说说。

十二、其他话题

关于 SEO,怎么做的,结果怎么样分析完了。但是其实,这是一个系统性的问题。 SEO 流量的增长并不是我们的核心目标,目标还是提高销售额。但是 SEO 前期增长迅猛,确实对应的咨询数、商机线索 (关于商机线索的定义以后有时间可以讲一下,咨询、 MQL 、 SQL 的定义和转化链路) 有明显的提升,但是随着后期的继续增长,咨询和商机线索的增量开始出现与 SEO 流量不同幅度的情况,大幅度放缓。

SEO 流量的特征之一,就是流量相对不可控 (关键词无法绝对定向),导致会有很多无效流量进入网站,造成网站的服务资源压力。如何提高有效流量、过滤无效流量,在后续转化路径中提高流量的转化效率从而促成成单,作为别的话题以后可以分享探讨。

总结

1 年的 SEO 工作和成功,总结如下:

  • SEO 流量是免费的,高性价比的
  • SEO 流量池是宽广的
  • SEO 是复杂的 (因为要先明白搜索引擎原理),SEO 也是简单的 (好好做好网站内容其实是根本)
  • SEO 流量质量 (相对 SEO 、第三方网站引流) 较差
  • SEO 不是银弹,不能解决客户增长的所有问题,甚至在一定维度上有负面影响
  • SEO 应该做 (至少对 B 端客户),但是在某个阈值之后不再具有性价比,应该适可而止

总结概览图

最后附上整个项目结束后,我复盘我们到底是怎么做的,给自己理清思路用的概览图,有需要的同学自取

4807fdac-9599-11ee-826f-00163e0b5ff3

文章暂时不能评论,有问题可以到讨论区发帖
© 版权声明
THE END
喜欢就支持一下吧