{"id":543,"date":"2015-07-19T08:06:47","date_gmt":"2015-07-19T08:06:47","guid":{"rendered":"http:\/\/www.seoexpert.rs\/blog\/?p=543"},"modified":"2019-01-31T00:22:58","modified_gmt":"2019-01-31T00:22:58","slug":"indeksiranje-i-deindeksiranje","status":"publish","type":"post","link":"https:\/\/www.seoexpert.rs\/blog\/indeksiranje-i-deindeksiranje\/","title":{"rendered":"Indeksiranje i [deindeksiranje] novih\/starih URL strana iz pozicije Gugla"},"content":{"rendered":"<p>Ve\u0107ina portala\/sajtova pored produkcijske verzije iz opravdanih razloga nema testno i razvojno okru\u017eenje, <strong>ve\u0107 sav razvoj se radi na &#8222;\u017eivo&#8220;<\/strong>. Ovakva organizacija usled male nepa\u017enje ume da unese\u00a0poprili\u010dno nezahvalnu komunikaciju sa Google spajderima koji sa nestrpljenjem \u010dekaju da u realnom vremenu pokupe svaki novi bit i \u010dim pre plasiraju najsve\u017eiju informaciju sa tr\u017ei\u0161ta.<\/p>\n<figure style=\"width: 389px\" class=\"wp-caption alignright\"><a href=\"http:\/\/www.tt-group.net\/video\/legenda-o-davoljem-kamenu\/\" target=\"_blank\" rel=\"nofollow noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"\" src=\"http:\/\/www.tt-group.net\/video\/wp-content\/uploads\/2012\/09\/Djaveljev-kamen.jpg\" alt=\"Vra\u017eja stena i mosti\u0107 preko P\u010dinje\" width=\"389\" height=\"587\" \/><\/a><figcaption class=\"wp-caption-text\">Vra\u017eja stena i mosti\u0107 preko P\u010dinje, Trgovi\u0161te (za vi\u0161e detalja klik na sliku).<\/figcaption><\/figure>\n<p>Da bi optimalno koristili resurse (<strong>crawl budget<\/strong>) koji imamo kod \u010dika Gugla kad je u pitanju <strong>indeksiranje\/reindeksiranje<\/strong>\u00a0dela ili celog sajta, evo nekoliko bitnih stvari koje mo\u017eda znate, ali nije na odmet da se jo\u0161 jednom utvrde. Ponavljanje je majka znanja, a kroz komentare mo\u017eemo da ih i dodatno prodiskutujemo ukoliko postoji kakva god dilema usled druga\u010dije iskustvene \u010dinjenice.<\/p>\n<h2>1. robots.txt datoteka<\/h2>\n<p><strong>Prvo ono \u0161to spajderi<\/strong> (pauci ili robotizovane skripte, botovi, sinonima ima na pretek)\u00a0 urade kad do\u0111u na novi\/stari sajt je <strong>poseta robots.txt datoteci<\/strong>. Ovde se informi\u0161u da li su dobrodo\u0161li i da li postoji neki folder koji ne bi trebalo da se indeksira. Na primer ako postoji neki teku\u0107i projekat koji je krenuo sa radom i jo\u0161 uvek nije gotov, onda <strong>eksplicitno u robots.txt datoteci treba zabraniti pristup<\/strong> istom pre samog po\u010detka projekta. Sve ovo va\u017ei i za testno i razvojno okru\u017eenje. Guglove skripte nikako ne bi trebalo da vr\u0161ljaju ni po \u010demu drugom osim po produkcijskim informacijama.<\/p>\n<p>Problem nastaje kada Google indeksira na primer testno ili razvojno okru\u017eenje, a programer tek naknadno postavi zabranu u robots.txt datoteci. <strong>Zabrana u robots.txt datoteci ne doprinosi deindeksiranju URL-ova<\/strong> koji su pobrojani u disallow strukturi, ve\u010d samo zabranu daljeg a\u017euriranja istih.<\/p>\n<p>Pre nego analiziram situaciju kako deindeksirati ono \u010demu nije mesto na SERP-u (ta\u010dka 3 u ovom \u010dlanku), spomenu\u0107u koji je slede\u0107i korak koji Bot preduzima u mirnodopskim aktivnostima.<\/p>\n<h2>2. XML mapa\/mape sajta<\/h2>\n<p>Nakon \u0161to je Google pauk utvrdio svoja ovla\u0161\u0107enja iz robots datoteke, on i dalje ne pristupa va\u0161em sajtu, \u00a0nego u\u010ditava XML mapu\/mape sajta i proverava \u0161ta se u njoj de\u0161ava novo. Za kreiranje XML mape postoje razli\u010diti alati, tj. <strong>postoji vi\u0161e standarda za XML mapu<\/strong>, a evo koji ja koristim <a href=\"https:\/\/www.seoexpert.rs\/sitemap.xml\">https:\/\/www.seoexpert.rs\/sitemap.xml<\/a> i jo\u0161 jednu kompleksnu strukturu za <a href=\"https:\/\/www.seoexpert.rs\/blog\/sitemap.xml\"><strong>blog<\/strong><\/a>.<\/p>\n<p><strong>Pored datuma poslednjeg a\u017euriranja<\/strong> ubacujem <strong>podatak o prioritetu<\/strong> tog URL-a na celom sajtu, kao i moju preporuku \u010dika Guglu koliko \u010desto da a\u017eurira taj URL. <strong>Podse\u0107am vas da lokaciju XML mape povezujete sa Guglom kroz Webmaster Tools (WT)<\/strong>. Prioritet posmatranog URL-a u XML mapi proizilazi iz va\u0161e SEO strategije. Prioritet nekog URL-a defini\u0161e pozicija tog URL-a u celoj arhitekturi sajta, kao i koli\u010dina internih, izlaznih i dolaznih linkova na i ka njemu + relevantnost iz ugla aktivnosti posetioca. Kad god ne\u0161to krupno radite na sajtu, refre\u0161ajte XML mape iz Webmaster Toolsa radi \u0161to br\u017eeg reindeksiranja. Uvek sa\u010dekajte da pregledate i korigujte eventualne gre\u0161ke\/sugestije tokom procesa obrade podataka iz mape.<\/p>\n<p><strong>Ukoliko ne postoje robots i XML fajlovi<\/strong> ili postoje a nisu ta\u010dni Google\/Bing sami planiraju svoju agendu indeksiranja. Ako govorimo o <a href=\"https:\/\/www.seoexpert.rs\/seo-optimizacija.php\"><strong>SEO optimizaciji<\/strong><\/a> upravo je ideja da optimizujemo serversku snagu koju nam Google stavlja na raspolaganje i najefikasnije i najbr\u017ee usmerimo botove tamo gde im je mesto, tj. \u00a0implementirajte ove funkcionalnosti ako ve\u0107 niste.<\/p>\n<h2>3. A \u0161ta da radim kad je indeksirano ono \u0161to ne \u017eelim da bude indeksirano<\/h2>\n<p>U praksi \u010desto se de\u0161ava da Google indeksira i plasira na rezultatima pretrage URL-ove koje prosto ne \u017eelimo da ih iko vidi. Na primer, stranica proizvoda koja odavno ne postoji u prodaji, grupa URL-ova koji su jo\u0161 uvek u izradi, nekompletna migracija sa jednog na drugi CMS, razne faze redizajna, razvoja i tako dalje. Kretivnost slu\u010dajeva ne manjka.<\/p>\n<p>Osnovni principi najbolje prakse pobroja\u0107u ispod, a vi se prilagodite situaciji koja najpribli\u017enije oslikava va\u0161u,<\/p>\n<p>&#8211; <strong>URL-ovi koje treba deindeksirati imaju ka sebi SEO linkove od spolja<\/strong>. Ovo je obi\u010dno slu\u010daj sa ne vi\u0161e od dvadesetak URL-ova i onda\u00a0se radi 301 redirekcija na novi korespodentni URL ili pak na naslovnu, pa nek se SEO prirodno preraspore\u0111uje. Izuzetak mo\u017ee postojati\u00a0ukoliko je takav URL penalizovan od strane Pingvin filtra usled <a href=\"https:\/\/www.seoexpert.rs\/blog\/negativni-seo-i-alati-za-profesionalnu-analizu-link-profila\/\"><strong>agresivnog link buildinga<\/strong><\/a>, \u0161to potra\u017euje mnogo \u0161iru analizu koju sada\u00a0preska\u010dem.\u00a0Ukoliko \u017eelite privremeno preusmeravanje koristite 302\u00a0redirekciju.<\/p>\n<p>&#8211; <strong>URL-ovi nemaju ka sebi dolazne linkove i ima ih vi\u0161e od 100<\/strong>. Teorija\/praksa ka\u017ee da je najbolje da ih ostavimo u 404 statusu, i \u010dim ih Google\u00a0reindeksira on \u0107e ih deindeksirati iz svog search-a, tj. vi\u0161e ih ni ne razmatra. \u00a0Google voli 404. Postoji i 410 status, to je <strong>trajno deindeksiranje<\/strong> i jedina razlika u odnosu na 404 je \u0161to 410 tra\u017ei mnogo vi\u0161e vremena ako iz nekog\u00a0razloga odlu\u010dite da opet o\u017eivite taj URL.<\/p>\n<p>&#8211; <strong>Ako nepo\u017eeljnih URL-ova nema vi\u0161e od 100<\/strong> mo\u017ee se koristiti po jedan meta tag u head-u HTML-a, <strong><em>&lt;meta name=&#8220;robots&#8220; content=&#8220;noindex, follow&#8220;&gt;<\/em><\/strong> koji\u00a0govori pretra\u017eiva\u010dima da ne listaju taj URL na SERP-u, ali da sa njega uklju\u010de u razmatranje linkove. Neki SEO&#8217;i recimo kategorije u okviru\u00a0WordPress-a stavljanju u &lt;meta name=&#8220;robots&#8220; content=&#8220;noindex, follow&#8220;&gt; \u0161to ja ne bih preporu\u010dio. <strong>Ako kategorije birate kao tematske celine<\/strong>, a\u00a0jo\u0161 su polinkane anchor tekstovima u horizontalnom meniju, nema potrebe rasipati SEO. Na primer za kategoriju &#8222;<a href=\"https:\/\/www.google.rs\/search?q=misti%C4%8Dna+mesta\" target=\"_blank\" rel=\"nofollow noopener noreferrer\"><strong>Misti\u010dna mesta<\/strong><\/a>&#8220; ili &#8222;Turska\u00a0putopisi&#8220;, na TT Group portalu nalazim se <a href=\"https:\/\/www.seoexpert.rs\/prvi-na-google-faq.php\"><strong>na prvom, drugom mestu na Guglu<\/strong><\/a>.<\/p>\n<p>Mislim da su defoltne postavke na SEO WP plaginovima pode\u0161ene da\u00a0kategorije bude (Noindex, follow) i to obavezno proverite. Sa ovim nemojte da se igrate ako u potpunosti niste sigurni \u0161ta radite. Zaklju\u010dak je da 301\/404 ne tro\u0161i, a &lt;meta name=&#8220;robots&#8220; content=&#8220;noindex, follow&#8220;&gt; itekako tro\u0161i crawl bud\u017eet.<\/p>\n<p>&#8211; <strong>Canonical meta tag<\/strong>.\u00a0Ukoliko ne koristite responsive verziju, ve\u0107 posebnu verziju za mobilne ure\u0111aje onda je\u00a0odavno\u00a0trebalo da imate i ovaj tag u izvedenoj verziji. Tj, da URL sa istom informacijom na strani za desktop i URL sa istom informacijom za mobilni\u00a0ure\u0111aj od strane Gugla ne bi bio do\u017eivljavan kao duplicirani sadr\u017eaj treba da se \u00a0koristi <strong>canonical meta tag<\/strong>.<\/p>\n<p>Ako imate responsive web sajt, dobra praksa je da svaki URL bude canonical na samog sebe, da ako se dese neki svi\u010devi po URL-u ne bude nikakvih nerazumevanja za botove. Princip je da uvek nedvosmisleno ka\u017ee\u0161te Guglu \u0161ta smerate i da mu ne dajete prostora da on izra\u017eava svoju kreativnost \ud83d\ude09 Ve\u0107ina\u00a0aktuelnih WordPress platformi je responsive i <strong>canonical meta tag<\/strong> je implementiran za sve svi\u010deve koji se kaleme na defoltni URL.<\/p>\n<p>Pogledajte ovaj video klip koji demistifikuje mitove o 301, 201 i canonical direktivama:<\/p>\n<p><iframe loading=\"lazy\" src=\"http:\/\/fast.wistia.net\/embed\/iframe\/37hhrhquz8\" name=\"wistia_embed\" width=\"480\" height=\"298\" frameborder=\"0\" scrolling=\"no\"><\/iframe><\/p>\n<p>Ovde treba spomenuti samo\u00a0slede\u0107i izuzetak. Ukoliko imate neki custom CMS i landing stranu sa varijacijama, tipa &#8222;plava pamu\u010dna majca sa kragnom&#8220;, ne treba kreirati za svaku boju jo\u0161 po\u00a0jednu nego sa canonical tagom iskonfigurisati ostale u odnosu na defoltnu. Drugim re\u010dima i da postoje vi\u0161e razli\u010ditih URL-ova koji se razlikuju\u00a0samo po jednom pridevu, u Google indeksu treba da bude samo jedan URL. Sve ostalo bi na neki na\u010din vodilo ka kanibalizaciji koju u eri semanti\u010dke\u00a0pretrage gledajte da je zaobi\u0111ete u \u0161to \u0161irem luku.<\/p>\n<h2>4. Paginacija i iskustva kako je implementirati<\/h2>\n<p>&#8211; <strong>Paginacija, na primer 1 | 2 | 3| 4 &#8230; <\/strong>za slu\u010daj\u00a0da u arhitekturi sajta imate paginaciju na kategorijama ili tagovima, tj. ako\u00a0kategorija vesti posle dvadeset \u010dlanaka prelazi na stranu 2, pa posle narednih dvadeset na stranu 3 i tako dalje. Jedno od fensi re\u0161enja je <strong>beskona\u010dni skrol<\/strong> i \u00a0iz SEO ugla to je skroz ok re\u0161enje. \u00a0Ako imate beskona\u010dni skrol stavite canonical tag na sam URL i ne morate da se brinete vi\u0161e ni oko \u010dega. Title je uvek jedan, description je uvek jedan, sve je index, follow sa napomenom da Gugl vidi na kategoriji samo prvi kontigent \u010dlanaka (u na\u0161em primeru 20 vesti koje su na vrhu).<\/p>\n<p>Ali ako ste tradicionalista imate dve varijante:<\/p>\n<p>a. Paginacija <strong>1 | 2 | 3| 4\u00a0<\/strong>koja pored\u00a0<em><strong>nav-previous (rel=&#8220;prev&#8220;)<\/strong><\/em> i\u00a0<em><strong>nav-next (rel=&#8220;next&#8220;)<\/strong><\/em>\u00a0mora da unosti dodatnu informaciju u Title i Desc tipa strana 2, strana 3 i tako redom. Sadr\u017eaji na svim stranama su unikatni (nema kanibalizacija) i mirni ste iz SEO ugla. Ovo ima smisla ako neko ba\u0161 pretra\u017euje sa Gugla va\u0161e kategorije, pa da mu se nude vi\u0161e rezultata, ali obi\u010dno to nije slu\u010daj pa se pristupa slede\u0107em sve zastupljenijem re\u0161enju.<\/p>\n<p>b. Paginacija ima i dalje\u00a0<em><strong>nav-previous (rel=&#8220;prev&#8220;)<\/strong><\/em>\u00a0i\u00a0<em><strong>nav-next (rel=&#8220;next&#8220;)<\/strong><\/em><em><strong>. <\/strong>U head-u HTML-a <\/em>definisan je \u00a0naravno canonical meta tag svakog URL-a na samog sebe i ono \u0161to je novo je slede\u0107e.<\/p>\n<p>Svi URL-ovi osim strane 1 imaju <strong>&lt;meta name=&#8220;robots&#8220; content=&#8220;noindex,follow&#8220;\/&gt;<\/strong> ovo zna\u010di da \u0107e Gugl prera\u010dunati SEO sa svih paginacijama, ali prosto ne\u0107e nuditi stranu 2, 3 i dalje na pretrazi, jer je pretpostavka da na sve diferenciranijem i konkurentnijem webu je te\u0161ko da na SERP-u jedan sajt bude listan sa vi\u0161e URL-ova iz iste paginacije (pripadaju istoj kategoriji). Title i desc na svim stranama mogu biti isti jer <strong>noindex tag<\/strong> elimini\u0161e dupliciranost.<\/p>\n<h3>Umesto zaklju\u010dka<\/h3>\n<p>Da bi optimalno tro\u0161ili crawl bud\u017eet da li su vam kristalno jasni pojmovi i funkcionalnosti: <strong>rotots.txt<\/strong> datoteke i disavow entiteta u njoj, <strong>XML mape<\/strong>\u00a0sajta, <strong>301, 302, 404 i 410<\/strong> statusa, <strong>canonical<\/strong> i <strong>&lt;meta name=&#8220;robots&#8220; content=&#8220;noindex, follow&#8220;&gt;<\/strong> meta tagova. Ako ne\u0161to nije jasno proguglajte malo\u00a0dodatne literature i onda sa svim ovim funkcionalnostima kombinujte slu\u010daj koji re\u0161ava va\u0161 problem.<\/p>\n<p>Odavno sam planirao da ovo ispri\u010dam na blogu, a ubrzao me <strong>Rand Fishkin<\/strong>\u00a0(ina\u010de smo generacija \u00a0&#8217;79. godine) svojim poslednjim videom 17. 07. u kategoriji <a href=\"https:\/\/moz.com\/blog\/category\/whiteboard-friday\" target=\"_blank\" rel=\"nofollow noopener noreferrer\"><strong>White Board Friday<\/strong><\/a>.<\/p>\n<p>Preslu\u0161ajte\/pregledajte sada sve ovo i u njegovoj interpretaciji:<\/p>\n<p><iframe loading=\"lazy\" src=\"http:\/\/fast.wistia.net\/embed\/iframe\/gbxtj38bp2\" name=\"wistia_embed\" width=\"480\" height=\"298\" frameborder=\"0\" scrolling=\"no\"><\/iframe><\/p>\n<p>Edit (25. avgust):<\/p>\n<p>Pogledajte jo\u0161 jedan video klip u kome <strong>Jon Miler<\/strong>, glavni analiti\u010dar u Guglu komentari\u0161e celokupnu problematiku o kojoj smo pri\u010dali. Idealno za po\u010detnike.<\/p>\n<p><iframe loading=\"lazy\" src=\"https:\/\/www.youtube.com\/embed\/yIIRyBMSPUk\" width=\"560\" height=\"315\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ve\u0107ina portala\/sajtova pored produkcijske verzije iz opravdanih razloga nema testno i razvojno okru\u017eenje, ve\u0107 sav razvoj se radi na &#8222;\u017eivo&#8220;. Ovakva organizacija usled male nepa\u017enje ume da unese\u00a0poprili\u010dno nezahvalnu komunikaciju sa Google spajderima koji sa nestrpljenjem \u010dekaju da u realnom vremenu pokupe svaki novi bit i \u010dim pre plasiraju najsve\u017eiju informaciju sa tr\u017ei\u0161ta. Da bi [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1064,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[68],"class_list":["post-543","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-on-page-optimizacija","tag-napredni-seo"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/posts\/543","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/comments?post=543"}],"version-history":[{"count":20,"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/posts\/543\/revisions"}],"predecessor-version":[{"id":1762,"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/posts\/543\/revisions\/1762"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/media\/1064"}],"wp:attachment":[{"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/media?parent=543"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/categories?post=543"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.seoexpert.rs\/blog\/wp-json\/wp\/v2\/tags?post=543"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}