Агляд Semalt - Атрыманне ўласнага скрабка для аналізу спасылак

Як эксперт па аптымізацыі пошукавай сістэмы, мне прыходзіць шмат пытанняў, але ў мяне няма простых рашэнняў для іх вырашэння. Большасць з іх тычыцца спісаў прафілявання URL-сайтаў на аснове інфармацыі, змешчанай у змесце старонкі. Таму я вырашыў выкарыстаць карыстацкую пошукавую сістэму Google, хоць яна не прапанавала поўнага рашэння. Некаторыя з рашэнняў, якія я хацеў бы аўтаматызаваць, уключаюць цалкам:

  • Разбурэнне сеткі
  • Складанне асноўных ключавых слоў, якія выкарыстоўваюцца для даследавання ключавых слоў
  • Ацэнка актуальнасці URL-спасылак
  • Атрыманне крыніц спасылак з пэўных сістэм CMS
  • Майнінг для вэб-блогераў, якія спецыялізуюцца ў пэўнай нішы
  • Адсочванне змесціва

Падарожжа пачалося з распрацоўкі асноўнага скрабка, які выкарыстоўваецца як доказ канцэпцыі для больш складанага аналізу спасылак. Выкарыстанне Caveats, які з'яўляецца хутчэй інструментам канцэпцыі, а не адшліфаваным інструментам, патрабуе тэхнічных навыкаў і навыкаў праграмавання для поўнай перавагі. Яго эфектыўнасць маштабаванасці можа павялічыць любы спецыяліст па праграмаванні.

Як стваральнік спасылак, трэба было б прыдумаць грунтоўны спіс блогераў у нішы, якая прывязвае да маіх апанентаў. Сюды ўваходзяць блогі, на якія я магу арыентавацца ў гасцявых блогах, каменціроўках, размяшчэнні змесціва і сацыяльных сетках. Выкарыстанне такога інструмента, як Open Site Explorer, прапануе вам выхад для злучэння даменаў, але не дае канкрэтных дадзеных пра змесціва даменаў.

Першы крок - ідэнтыфікацыя сайта з выкарыстаннем надзейнага сцэнарыя. Ён пачынаецца з выхаду генератара, які ствараецца шматлікімі ЦС. Іншыя праверкі ўключаны пры распрацоўцы.

Інструмент апрацоўвае спіс спасылак і вызначае яго CMS, выводзіць неапрацаваныя дадзеныя ў CSV, захоўваючы пры гэтым дадзеныя OSE цэлымі. Інструмент будзе праходзіць праз усе URL-адрасы, кэшаваць змесціва і аналізаваць зыходны код

Пошук дзённікаў

Першапачатковая настройка палягчае пошук дзённікаў, якія спасылаюцца на distilled.co.uk. Гэта галоўны момант для адкрыцця новых блогаў. Можна сабраць вынікі ад розных апанентаў і перакрыжаваць усе звязаныя дамены, каб атрымаць спасылкі на галоўную нішу.

Дадатковае выкарыстанне для CMS

Існуюць іншыя сляды ідэнтыфікацыі CMS, такія як мэтавыя старонкі для ўваходу, тэмы і тэчкі адміністратара. Можа быць распрацавана надзейная сістэма, якая дапаможа вызначыць CMS, які працуе на вэб-сайце. Яго карысна па наступных прычынах.

  • Пошук форумаў
  • Пошук сацыяльных CMS
  • Пошук вікі-сайтаў
  • Атрыманне спасылкі на тое, каб перайсці
  • Спасылкі кроплі

Вы таксама можаце праверыць прыняцце ўстаўкі, віджэтаў сайта і іншай інфаграфікі. Гэта лепш адсочваць шляхам налад апавяшчэнняў, пашыранага пошуку і фізічнага разняволення ў профільнай спасылцы.

Праверка прыдатнасці спасылкі - зваротная спасылка выводзіць асноўную інфармацыю, такую як URL і загаловак. Гэта не мае іншага значэння.

Іншыя задачы, якія ён можа выконваць, ўключаюць наступнае:

  • Пошук спасылак на каталог
  • Майнінг для сацыяльных уліковых запісаў, такіх як Facebook і Twitter
  • Адпрацоўка адрасоў электроннай пошты
  • Праверка сайтаў Adsense, якія манетызуюць
  • Ацэнка якасцяў спасылак і спаму