Zum Inhalt springen

Scraper Site

aus Wikipedia, der freien Enzyklopädie

Eine Scraper Site ist eine Website, die einen Großteil ihres Inhaltes von anderen Seiten kopiert hat. Ziel ist es in der Regel, automatisiert und mit geringem Aufwand eine Seite zu erstellen, die in den Ergebnislisten der Suchmaschinen gut platziert ist. Die Scraper Site verdient durch eingeblendete Werbung (z. B. Google AdSense) an den Besuchern.

Suchmaschinen wie Google oder Yahoo sind keine Scraper Sites, da die Textinhalte der fremden Webseiten erst als Ergebnis einer Suchanfrage angezeigt werden. Anders verhält es sich bei Suchmaschinen, die ihre Suchergebnisseiten indexierbar machen und diese innerhalb der Website verlinken. Suchmaschinen wie Google versuchen, solche Seiten aus Qualitätsgründen zu erkennen und aus ihrem Index auszuschließen.<ref>Technorati: <templatestyles src="Webarchiv/styles.css" />{{#if:20120419035357

      | {{#ifeq: 20120419035357 | *
    | Vorlage:Webarchiv/Wartung/Stern{{#if: Scraper Sites Beware | {{#invoke:WLink|getEscapedTitle|Scraper Sites Beware}} | {{#invoke:Webarchiv|getdomain|http://technorati.com/technology/article/scraper-sites-beware/}} }} (Archivversionen)
    | {{#iferror: {{#time: j. F Y|20120419035357}}
         | {{#if:  || }}Vorlage:Webarchiv/Wartung/DatumDer Wert des Parameters {{#if: wayback | wayback | Datum }} muss ein gültiger Zeitstempel der Form YYYYMMDDHHMMSS sein!
         | {{#if: Scraper Sites Beware | {{#invoke:WLink|getEscapedTitle|Scraper Sites Beware}} | {{#invoke:Webarchiv|getdomain|http://technorati.com/technology/article/scraper-sites-beware/}} }} {{#ifeq:  | [] | [ | ( }}Memento{{#if: {{#if:  | {{{archiv-bot}}} |  }} |  des Vorlage:Referrer }} vom {{#time: j. F Y|20120419035357}} im Internet Archive{{#if:  | ;  }}{{#ifeq:  | [] | ] | ) }}
      }}
  }}
      | {{#if:
          | {{#iferror: {{#time: j. F Y|{{{webciteID}}}}}
    | {{#switch: {{#invoke:Str|len|{{{webciteID}}}}}
       | 16= {{#if: Scraper Sites Beware | {{#invoke:WLink|getEscapedTitle|Scraper Sites Beware}} | {{#invoke:Webarchiv|getdomain|http://technorati.com/technology/article/scraper-sites-beware/}} }} {{#ifeq:  | [] | [ | ( }}Memento{{#if: {{#if:  | {{{archiv-bot}}} |  }} |  des Vorlage:Referrer }} vom {{#time: j. F Y| 19700101000000 + {{#expr: floor {{#expr: {{#invoke:Str|sub|{{{webciteID}}}|1|10}}/86400}} }} days}} auf WebCite{{#if:  | ;  }}{{#ifeq:  | [] | ] | ) }}
       | 9 = {{#if: Scraper Sites Beware | {{#invoke:WLink|getEscapedTitle|Scraper Sites Beware}} | {{#invoke:Webarchiv|getdomain|http://technorati.com/technology/article/scraper-sites-beware/}} }} {{#ifeq:  | [] | [ | ( }}Memento{{#if: {{#if:  | {{{archiv-bot}}} |  }} |  des Vorlage:Referrer}} vom {{#time: j. F Y| 19700101000000 + {{#expr: floor {{#expr: {{#invoke:Str|sub|{{#invoke:Expr|base62|{{{webciteID}}}}}|1|10}}/86400}} }} days}} auf WebCite{{#if:  | ;  }}{{#ifeq:  | [] | ] | ) }}
       | #default= Der Wert des Parameters {{#if: webciteID | webciteID | ID }} muss entweder ein Zeitstempel der Form YYYYMMDDHHMMSS oder ein Schüsselwert mit 9 Zeichen oder eine 16-stellige Zahl sein!Vorlage:Webarchiv/Wartung/webcitation{{#if:  || }}
      }}
    | c|{{{webciteID}}}}} {{#if: Scraper Sites Beware | {{#invoke:WLink|getEscapedTitle|Scraper Sites Beware}} | {{#invoke:Webarchiv|getdomain|http://technorati.com/technology/article/scraper-sites-beware/}} }} (Memento{{#if: {{#if:  | {{{archiv-bot}}} |  }} |  des Vorlage:Referrer}} vom {{#time: j. F Y|{{{webciteID}}}}} auf WebCite{{#if:  | ;  }}{{#ifeq:  | [] | ] | ) }}
  }}
          | {{#if: 
              | Vorlage:Webarchiv/Today
              | {{#if:
                      | Vorlage:Webarchiv/Generisch
                      | {{#if: Scraper Sites Beware | {{#invoke:WLink|getEscapedTitle|Scraper Sites Beware}} | {{#invoke:Webarchiv|getdomain|http://technorati.com/technology/article/scraper-sites-beware/}} }}  
                 }}}}}}}}{{#if:
    | Vorlage:Webarchiv/archiv-bot
  }}{{#invoke:TemplatePar|check
     |all      = url=
     |opt      = text= wayback= webciteID= archive-is= archive-today= archiv-url= archiv-datum= ()= archiv-bot= format= original=
     |cat      = Wikipedia:Vorlagenfehler/Vorlage:Webarchiv
     |errNS    = 0
     |template = Vorlage:Webarchiv
     |format   = *
     |preview  = 1
  }}{{#ifexpr: {{#if:20120419035357|1|0}}{{#if:|+1}}{{#if:|+1}}{{#if:|+1}}{{#if:|+1}} <> 1
    | {{#if:  || }}Vorlage:Webarchiv/Wartung/Parameter{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Genau einer der Parameter 'wayback', 'webciteID', 'archive-today', 'archive-is' oder 'archiv-url' muss angegeben werden.|1}}
  }}{{#if: 
    | {{#switch: {{#invoke:Webarchiv|getdomain|{{{archiv-url}}}}}
        | web.archive.org = 
          {{#if:  || }}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Im Parameter 'archiv-url' wurde URL von Internet Archive erkannt, bitte Parameter 'wayback' benutzen.|1}} 
        | webcitation.org = 
          {{#if:  || }}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Im Parameter 'archiv-url' wurde URL von WebCite erkannt, bitte Parameter 'webciteID' benutzen.|1}} 
        | archive.today |archive.is |archive.ph |archive.fo |archive.li |archive.md |archive.vn = 
          {{#if:  || }}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Im Parameter 'archiv-url' wurde URL von archive.today erkannt, bitte Parameter 'archive-today' benutzen.|1}}
      }}{{#if: 
         | {{#iferror: {{#iferror:{{#invoke:Vorlage:FormatDate|Execute}}|}}
             | {{#if:  || }}Vorlage:Webarchiv/Wartung/Parameter{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Der Wert des Parameter 'archiv-datum' ist ungültig oder hat ein ungültiges Format.|1}}
          |  }} 
         | {{#if:  || }}Vorlage:Webarchiv/Wartung/Parameter{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Der Pflichtparameter 'archiv-datum' wurde nicht angegeben.|1}}
      }}
    | {{#if: 
         | {{#if:  || }}Vorlage:Webarchiv/Wartung/Parameter{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Der Parameter 'archiv-datum' ist nur in Verbindung mit 'archiv-url' angebbar.|1}}
      }}
  }}{{#if:{{#invoke:URLutil|isHostPathResource|http://technorati.com/technology/article/scraper-sites-beware/}}
    || {{#if:  || }}
  }}{{#if: Scraper Sites Beware
    | {{#if: {{#invoke:WLink|isBracketedLink|Scraper Sites Beware}}
        | {{#if:  || }}
      }}
    | {{#if:  || }}Vorlage:Webarchiv/Wartung/Linktext_fehlt
  }}{{#switch: 
    |addlarchives|addlpages= {{#if:  || }}{{#if: 1 |Vorlage:Webarchiv/Wartung/Parameter}}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: enWP-Wert im Parameter 'format'.|1}}
  }}{{#ifeq: {{#invoke:Str|find|http://technorati.com/technology/article/scraper-sites-beware/%7Carchiv}} |-1
    || {{#ifeq: {{#invoke:Str|find|{{#invoke:Str|cropleft|http://technorati.com/technology/article/scraper-sites-beware/%7C4}}%7Chttp}} |-1
         || {{#switch: {{#invoke:Webarchiv|getdomain|http://technorati.com/technology/article/scraper-sites-beware/ }}
              | abendblatt.de | daserste.ndr.de | inarchive.com | webcitation.org = 
              | #default = {{#if:  || }}{{#if: 1 |Vorlage:Webarchiv/Wartung/URL}}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Archiv-URL im Parameter 'url' anstatt URL der Originalquelle. Entferne den vor der Original-URL stehenden Mementobestandteil und setze den Archivierungszeitstempel in den Parameter 'wayback', 'webciteID', 'archive.today' oder 'archive-is' ein, sofern nicht bereits befüllt.|1}}
            }} 
       }}
  }}</ref><ref>Google Webmaster-Zentrale: Duplicate Content aufgrund von Scraper-Sites</ref><ref>Scraper Site: Definitionen & Erklärungen</ref>

Siehe auch

Quellangaben

<references />