Site fájl létrehozása, a helyes beállítást iránymutatások példákkal, ellenőrizze - seo blog pingo
Robots.txt - azaz, miért van szükség és hol él?
Így az első oktatási program azok számára, akik teljesen ismeretlenek a témát.
Robots.txt - egy szöveges fájl, amely utasításokat helyszínen indexelési kereső robotokat. Ebben a fájlban a webmester paraméterek határozhatók meg indexelni a webhely összes robot egyszerre, és az egyes keresési külön rendszer (például google).
A szerkezet és a megfelelő beállítás a robots.txt fájl
1. irányelv User-agent
Mit kell írni ebben a részben? Ez az irányelv előírja, hogy bizonyos, hogy egy robot tervezett az alábbi utasításokat. Például, ha szánják őket a robotok, elegendő tervezni a következő:
A robots.txt fájl szintaxisa karakter „*” egyenértékű az „semmit.” Ha meg szeretné adni utasítást adott kereső, vagy robot, a csillagok helyett az előző példa van írva a neve, például:
Minden kereső, van egy sor, hogy a robotok funkciókat látnak el. Yandex kereső robotok itt bemutatásra. Általánosságban az ott van a következő:
- Yandex - jelzi a robot Yandex.
- GoogleBot - Google indexeli az alap robot.
- MSNBot - alapanyagok indexelő robot Bing.
- Aport - Aport robotok.
- Mail.Ru - robotok PS Mail.
Ha van egy irányelv egy adott kereső, vagy robot, az általános figyelmen kívül hagyja.
2. Hagyja irányelv
Lehetővé teszi, hogy külön részben az oldalon, ha, mondjuk, már korábban teljesen zárva indexálás. Például:
User-agent: *
Disallow: /
Hagyjuk: /otkrytaya-stranitsa.html
Ebben a példában nem engedélyezzük indexelés az egész site kivéve poni.html oldal
Ez az opció használható bizonyos mértékig, hogy jelezze kivételek által meghatározott szabályok az irányelv tiltása. Ha nincsenek ilyen helyzetekben az irányelvet nem lehet használni egyáltalán. Ez nem teszi lehetővé, hogy nyissa ki a helyszínen, hogy indexelt, mint sokan gondolják, mert ha nincs tilalom típus Disallow: /, akkor nyitva van alapértelmezés szerint.
2. tiltása irányelv
Az ellentéte Allow és bezárja indexelni egyes oldalakat, szakaszokat vagy az egész oldalon. Ez egy analóg NOINDEX tag. Például:
User-agent: *
Letiltás: /zakrytaya-stranitsa.html
3. irányelv Host
Régen csak a Yandex, és rámutat az elsődleges tükör oldalon. Úgy néz ki, mint ez.
A fő tükör nélkül www: