Back to Question Center
0

Jak Semalt uznává datum zveřejnění příspěvku

1 answers:

Když něco hledám v Semaltu, někdy vidím datum publikování příspěvku / článku pod ním. Také jsem hledal vlastní článek, který mám na svém webu Wordpress, a Semalt také uznává datum jeho publikování.

Když otevírám zdroj webových stránek, nevidím žádné speciální značky ani nic, co by znamenalo datum publikování. Je napsáno pouze v pravidelném divu, bez speciálního označení, které by SE řeklo, že se jedná o datum publikování (mohu mít i další data dalších věcí kolem stránky) - conconi test laufenn.

Takže je to tak, že do stromu DOM pevně kopíruje přesné místo data publikace Semalt, nebo něco mi chybí?

Vytvářím novou webovou stránku s vlastním systémem CMS a snažím se zjistit, jak implementovat uznávané zveřejnění.

February 13, 2018

, měli byste projít XML Sitemap nebo RSS feed, aby index vaše publikovaná data prostřednictvím hlavních vyhledávačů, jako je Google, Yahoo a MSN. Vygenerujte XML Sitemap pro své webové stránky a odešlete je do webových nástrojů pro index.

Měl jsem problém, že všechny mé hlavní stránky byly zobrazeny jako aktualizované před více než 4 lety, i když Google , že to není pravda, protože stránky byly indexovány tak dlouho a výrazně se měnit měsíčně. Poté, co jsem byl skutečně zmatený, pak naštvaný, pak zmatený, konečně jsem našel ten problém. Naše právní podmínky byly slouženy ve skrytém divu s "Poslední aktualizace: 30.října 2007" a div byla načítána téměř na všech našich stránkách. (Protože se objeví při registraci) Odstranil jsem ji a teď předpokládám, že datum zmizí nebo bude opraveno na něco rozumnějšího.

Výstražný příběh a další důkaz, že kontroluje sémantiku místa více než technické detaily nebo vlastní historii indexování.

Velmi pochybuji o tom, že zveřejněný den příspěvku nebo článku je založen na položce v souboru Sitemap XML (jak jiní navrhli) nebo poslední modifikované hlavičce HTTP. Mapa stránek XML je pouze poradní, nikoliv autoritativní. Datum poslední změny dokumentu pravděpodobně není stejné jako datum (originál) publikace článku. A jak jsem se zmínil ve svém komentáři v horní části stránky, poslední změněný datum dokumentu je pravděpodobně důležitější pro ukládání do mezipaměti a možná určení rychlostí procházení. Poslední modifikovaná hlavička HTTP dynamicky generovaných stránek je často velmi blízká skutečnému datu / času (stejně jako pro blogy WordPress).

RSS / Atom feed na druhé straně obsahuje tento specifický nugget informací. A skutečně, na stránkách Wordpress, které nezahrnují datum publikování v obsahu, datum zveřejnění se stále objevuje ve výsledcích vyhledávání Google. A pokud můžu říct, toto odpovídá datu v RSS kanálu.

EDIT # 1: Zdroj RSS však nutně neobsahuje všechny stránky. Ve většině případů by měla obsahovat pouze nejnovější nebo naposledy aktualizované stránky. Ale není důvod, aby Google zapomněl na to, co již četl a že obsah této stránky se nezměnil, ani poslední změněný datum.

Pokud není k dispozici žádný RSS kanál, myslím, že Google je dostatečně šikovný, aby analyzoval obsah stránky. Zvláště pokud jsou data označena "sémanticky" pomocí mikroformátů . Je naprosto možné, že společnost Google považuje za oficiálně zveřejněné datum pro článek, který obsahuje:

  
Pátek 27. srpna 2010
 

Google určitě čte mikroformáty - hCard, hReview atd.

Stačí přidat, nemyslím si, že Google by zveřejnil datum zveřejnění, pokud by nebylo schopno najít něco autoritativního, což by naznačovalo toto. Nebude to vyvozovat "datum zveřejnění" na spekulativních datech, protože nesprávný "datum publikování" nikomu nepomůže a společnost Google by za to dostala hodně hůlku!

A jen pro záznam (pokud @Tom naznačuje jinak :) Myslím, že příspěvky / články by měly mít zveřejněné datum viditelně zobrazené. Mnoho z nich ne, a to může být pro čtenáře frustrující, zvláště při zkoumání technologických otázek a zjistíte, že když jste přečetli článek v jeho článku, jsou zastaralé!

EDIT č. 2: Od té doby jsem zaznamenal podobnou nepříjemnost , že @mmdanziger podrobněji odpověděl. Na jednom z mých starých stránek mám text v podobě formuláře "Site Last Updated Sun 17th Jun 2012" (není označen zvláštním způsobem) v horní části každé stránky (napsané na stránku s JavaScriptem! !). Tento stejný termín byl vzat Google a nyní se objeví spolu s několika (ale ne všemi) stránkami, které se objevují v SERPS - to určitě není datum zveřejnění stránky. Zdá se, že Google jednoduše vyřazuje stránku pro řetězec formuláře "last updated ( datestring )" (po zpracování JavaScript). Tento konkrétní web nemá RSS kanál. Stránky mají soubor Sitemap. xml soubor, ale data jsou různá.

Také jsem si všiml podobného chování na jiných stránkách.

Myslím, že společnost Google používá soubor Sitemap a RSS kanál k rozpoznání zveřejněného data. můžete tuto funkci implementovat do vašeho CMS vytvořením xml webu podle Standards .

   2011-08-18  

Myslím, že inteligentně hledá data na stránce a když je přesvědčena, že je to relevantní datum,.

Je to trochu obtížné někdy, protože si myslím, že to může mít negativní dopad na schopnost kliknutí SERP, myslím, že to může mít dočasný pozitivní dopad, pokud je to nedávný článek / příspěvek, ale jsem si docela jistý, že mé stránky by byly lepší bez něj (vyhledávači Google nemusí být lépe, aniž by to!)

Neexistují žádné možnosti, jak ji ovládat prostřednictvím služby Google, pouze pomocí vlastních metod. Můžete buď:

  • Nahraďte data dynamicky generovanými obrázky a snažte se, aby společnost Google tuto možnost nezjistila, což však může vést k dalším problémům, jako je vizuální zarovnání / konzistentní zobrazení / přístupnost písma atd.
  • Vymažte všechny data ze stránek (toto může být pro návštěvníky / uživatele zneklidňující, pokud chcete zjistit věk zdroje, pokud máte relevantní informace).

Z těchto důvodů bych to prostě ignoroval.