Zum Inhalt springen

hebOCR

aus Wikipedia, der freien Enzyklopädie
{{#if: hebOCR | hebOCR | {{#invoke:WLink|getArticleBase}} }}

{{#if: Datei:Hocr-logo.png |

colspan="2" class="notheme" style="text-align:center; background:#Vorlage:Standardfarbe; color:#202122;" | Datei:Hocr-logo.png |
 {{#if: {{#invoke:Wikidata|claim|P154}} | 
[[Datei:{{#invoke:Wikidata|claim|P154}}|150px]]
 }}

}}{{#if: Datei:Hocr-bialik-1.png |

Datei:Hocr-bialik-1.png{{#if: |
}}|

}}

Basisdaten

{{#if: |

Hauptentwickler
 {{#if: {{#invoke:Wikidata|claim|P126}} | 
Maintainer claim|P126|parameter=link|references=ja|list=, }}
 }}

}}{{#if: Yaacov Zamir |

Entwickler
 {{#if: {{#invoke:Wikidata|claim|P178}} | 
Entwickler claim|P178|parameter=link|references=ja|list=, }}
 }}

}}{{#if: |

Erscheinungsjahr
 {{#if: {{#invoke:Wikidata|claim|P577}} | 
Erscheinungsjahr claim|P577|references=ja|list=, }} |
   {{#if: {{#invoke:Wikidata|claim|P571}} | 
Erscheinungsjahr claim|P571|references=ja|list=, }}
   }}
 }}

}}{{#ifeq: 0.11-rc1 | KEINE_ANGABE || {{#if: 0.11-rc1 |

Aktuelle Version
({{#if: | Vorlage:Datum – die Form mit drei unbenannten Parametern oder anderen einzelnen Zeiteinheiten ist veraltet und wird nicht mehr unterstützt. Bitte gib das Datum einfach im Klartext an.
format 2011-01-15 | {{#timefl:now|date}}}} {{{2}}} | T._Monat JJJJ}} lang= {{#switch: -|=de #default=de-AT
            }}
   }}

}}) }}

 {{#if: {{#invoke:Wikidata|claim|P348|P548|!Q3295609,Q51930650,Q2122918,Q21727724,Q1072356,Q6736813}} | 
Aktuelle Version claim|P348|P548|!Q3295609,Q51930650,Q2122918,Q21727724,Q1072356,Q6736813|references=ja}} {{#if: {{#invoke:Wikidata|claim|P348|P548|!Q3295609,Q51930650,Q2122918,Q21727724,Q1072356,Q6736813|qualifier=P577}} |
({{#invoke:Wikidata|claim|P348|P548|!Q3295609,Q51930650,Q2122918,Q21727724,Q1072356,Q6736813|qualifier=P577}}) }}}}}}

}}{{#ifeq: | KEINE_ANGABE || {{#if: |

Aktuelle Vorabversion
({{#if: | Vorlage:Datum – die Form mit drei unbenannten Parametern oder anderen einzelnen Zeiteinheiten ist veraltet und wird nicht mehr unterstützt. Bitte gib das Datum einfach im Klartext an.
format | {{#timefl:now|date}}}} {{{2}}} | T._Monat JJJJ}} lang= {{#switch: -|=de #default=de-AT
            }}
   }}

}}) }}

 {{#if: {{#invoke:Wikidata|claim|P348|P548|Q1072356,Q51930650,Q3295609,Q2122918,Q21727724}} | 
Aktuelle Vorabversion claim|P348|P548|Q1072356,Q51930650,Q3295609,Q2122918,Q21727724|references=ja}} {{#if: {{#invoke:Wikidata|claim|P348|P548|Q1072356,Q51930650,Q3295609,Q2122918,Q21727724|qualifier=P577}} |
({{#invoke:Wikidata|claim|P348|P548|Q1072356,Q51930650,Q3295609,Q2122918,Q21727724|qualifier=P577}}) }}}}}}

}}{{#if: |

Ausführungsumgebung
 {{#if: Linux (macOS) | 
Betriebssystem Linux (macOS) |
   {{#if: {{#invoke:Wikidata|claim|P306}} | 
Betriebssystem claim|P306|parameter=link|references=ja|list=, }}
   }}
 }}

}}{{#if: C, C++, Python |

Programmier­sprache C, C++, Python |
 {{#if: {{#invoke:Wikidata|claim|P277}} | 
Programmier­sprache claim|P277|parameter=link|references=ja|list=, }}
 }}

}}{{#if: Texterkennungssoftware |

Kategorie Texterkennungssoftware

}}{{#if: GPL 3 (Freie Software) |

Lizenz GPL 3 (Freie Software) |
 {{#if: {{#invoke:Wikidata|claim|P275}} | 
Lizenz claim|P275|parameter=link|references=ja|list=, }}
 }}

}}{{#if: |

deutschsprachig faculty|}} | ja | nein }}

}}{{#if: |

Sonstiges {{{Sonstiges}}}Vorlage:Infobox Software/Wartung/Sonstiges

}}{{#if: https://github.com/yaacov/hebocr |

https://github.com/yaacov/hebocr |
 {{#if: {{#invoke:Wikidata|claim|P856|notdeprecated=1}} | 
{{#invoke: WLink | formatURL | {{#invoke:Wikidata|claim|P856|parameter=link|notdeprecated=1}}}}
 }}

}}{{#if: |

Dateien [[c:Category:Created with {{{Dateien}}}|{{{Dateien}}}]]

}}

hebOCR (ehemals HOCR) ist eine freie Texterkennungssoftware für hebräische Schrift von Yaacov Zamir. Sie ist besonders für alte religiöse Texte und Poesie vorgesehen. Sie ist als freie Software auch mitsamt dem Quelltext unter der GPL veröffentlicht. Der Kern der Software ist die Programmbibliothek libhocr, die in C und C++ geschrieben ist. Dazu gibt es zwei Benutzerschnittstellen: das von Yuval Tanny mit Python und GTK erstellte hocr-gtk, das eine graphische Oberfläche bietet, und das Kommandozeilenprogramm hocr, das mehr Fähigkeiten hat und zur Automatisierung gedacht ist. Mit qHocr existiert auch eine (externe) Qt-basiertes, graphisches Frontend. Zur Bibliothek gibt es eine Python- und eine Perl-Anbindung, über die sie beispielsweise per Skript gesteuert werden kann.

hebOCR kann Texte mit Nikud verarbeiten, was für hebräische Poesie sehr wichtig ist, und mit komplexen Seitengestaltungen umgehen. Über GTK+ kann die Reihe der Bilddateiformate gelesen werden, die GTK+ unterstützt (einschließlich PNG, JPEG, TIFF, BMP). Weiterhin kann es mit einem Vorverarbeitungsschritt Schräglagen des Textes automatisch erkennen und ausgleichen, mit Flecken in der Vorlage umgehen und auch sehr dunkle, helle oder farbstichige Vorlagen verarbeiten. Erkennungsergebnisse werden mit UTF-8-Kodierung als einfacher ASCII-Text oder in das HTML-basierte hOCR-Format ausgegeben.

Die erste Version (0.2.0) wurde am 14. August 2005 veröffentlicht.<ref><templatestyles src="Webarchiv/styles.css" />{{#if:20090710001626

      | {{#ifeq: 20090710001626 | *
    | Vorlage:Webarchiv/Wartung/Stern{{#if: hocr.berlios.de/documentation/html | {{#invoke:WLink|getEscapedTitle|hocr.berlios.de/documentation/html}} | {{#invoke:Webarchiv|getdomain|http://hocr.berlios.de/documentation/html/index.html}} }} (Archivversionen)
    | {{#iferror: {{#time: j. F Y|20090710001626}}
         | {{#if:  || }}Vorlage:Webarchiv/Wartung/DatumDer Wert des Parameters {{#if: wayback | wayback | Datum }} muss ein gültiger Zeitstempel der Form YYYYMMDDHHMMSS sein!
         | {{#if: hocr.berlios.de/documentation/html | {{#invoke:WLink|getEscapedTitle|hocr.berlios.de/documentation/html}} | {{#invoke:Webarchiv|getdomain|http://hocr.berlios.de/documentation/html/index.html}} }} {{#ifeq:  | [] | [ | ( }}Memento{{#if: {{#if: 2018-04-14 05:56:02 InternetArchiveBot | 2018-04-14 05:56:02 InternetArchiveBot |  }} |  des Vorlage:Referrer }} vom {{#time: j. F Y|20090710001626}} im Internet Archive{{#if:  | ;  }}{{#ifeq:  | [] | ] | ) }}
      }}
  }}
      | {{#if:
          | {{#iferror: {{#time: j. F Y|{{{webciteID}}}}}
    | {{#switch: {{#invoke:Str|len|{{{webciteID}}}}}
       | 16= {{#if: hocr.berlios.de/documentation/html | {{#invoke:WLink|getEscapedTitle|hocr.berlios.de/documentation/html}} | {{#invoke:Webarchiv|getdomain|http://hocr.berlios.de/documentation/html/index.html}} }} {{#ifeq:  | [] | [ | ( }}Memento{{#if: {{#if: 2018-04-14 05:56:02 InternetArchiveBot | 2018-04-14 05:56:02 InternetArchiveBot |  }} |  des Vorlage:Referrer }} vom {{#time: j. F Y| 19700101000000 + {{#expr: floor {{#expr: {{#invoke:Str|sub|{{{webciteID}}}|1|10}}/86400}} }} days}} auf WebCite{{#if:  | ;  }}{{#ifeq:  | [] | ] | ) }}
       | 9 = {{#if: hocr.berlios.de/documentation/html | {{#invoke:WLink|getEscapedTitle|hocr.berlios.de/documentation/html}} | {{#invoke:Webarchiv|getdomain|http://hocr.berlios.de/documentation/html/index.html}} }} {{#ifeq:  | [] | [ | ( }}Memento{{#if: {{#if: 2018-04-14 05:56:02 InternetArchiveBot | 2018-04-14 05:56:02 InternetArchiveBot |  }} |  des Vorlage:Referrer}} vom {{#time: j. F Y| 19700101000000 + {{#expr: floor {{#expr: {{#invoke:Str|sub|{{#invoke:Expr|base62|{{{webciteID}}}}}|1|10}}/86400}} }} days}} auf WebCite{{#if:  | ;  }}{{#ifeq:  | [] | ] | ) }}
       | #default= Der Wert des Parameters {{#if: webciteID | webciteID | ID }} muss entweder ein Zeitstempel der Form YYYYMMDDHHMMSS oder ein Schüsselwert mit 9 Zeichen oder eine 16-stellige Zahl sein!Vorlage:Webarchiv/Wartung/webcitation{{#if:  || }}
      }}
    | c|{{{webciteID}}}}} {{#if: hocr.berlios.de/documentation/html | {{#invoke:WLink|getEscapedTitle|hocr.berlios.de/documentation/html}} | {{#invoke:Webarchiv|getdomain|http://hocr.berlios.de/documentation/html/index.html}} }} (Memento{{#if: {{#if: 2018-04-14 05:56:02 InternetArchiveBot | 2018-04-14 05:56:02 InternetArchiveBot |  }} |  des Vorlage:Referrer}} vom {{#time: j. F Y|{{{webciteID}}}}} auf WebCite{{#if:  | ;  }}{{#ifeq:  | [] | ] | ) }}
  }}
          | {{#if: 
              | Vorlage:Webarchiv/Today
              | {{#if:
                      | Vorlage:Webarchiv/Generisch
                      | {{#if: hocr.berlios.de/documentation/html | {{#invoke:WLink|getEscapedTitle|hocr.berlios.de/documentation/html}} | {{#invoke:Webarchiv|getdomain|http://hocr.berlios.de/documentation/html/index.html}} }}  
                 }}}}}}}}{{#if:2018-04-14 05:56:02 InternetArchiveBot
    | Vorlage:Webarchiv/archiv-bot
  }}{{#invoke:TemplatePar|check
     |all      = url=
     |opt      = text= wayback= webciteID= archive-is= archive-today= archiv-url= archiv-datum= ()= archiv-bot= format= original=
     |cat      = Wikipedia:Vorlagenfehler/Vorlage:Webarchiv
     |errNS    = 0
     |template = Vorlage:Webarchiv
     |format   = *
     |preview  = 1
  }}{{#ifexpr: {{#if:20090710001626|1|0}}{{#if:|+1}}{{#if:|+1}}{{#if:|+1}}{{#if:|+1}} <> 1
    | {{#if:  || }}Vorlage:Webarchiv/Wartung/Parameter{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Genau einer der Parameter 'wayback', 'webciteID', 'archive-today', 'archive-is' oder 'archiv-url' muss angegeben werden.|1}}
  }}{{#if: 
    | {{#switch: {{#invoke:Webarchiv|getdomain|{{{archiv-url}}}}}
        | web.archive.org = 
          {{#if:  || }}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Im Parameter 'archiv-url' wurde URL von Internet Archive erkannt, bitte Parameter 'wayback' benutzen.|1}} 
        | webcitation.org = 
          {{#if:  || }}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Im Parameter 'archiv-url' wurde URL von WebCite erkannt, bitte Parameter 'webciteID' benutzen.|1}} 
        | archive.today |archive.is |archive.ph |archive.fo |archive.li |archive.md |archive.vn = 
          {{#if:  || }}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Im Parameter 'archiv-url' wurde URL von archive.today erkannt, bitte Parameter 'archive-today' benutzen.|1}}
      }}{{#if: 
         | {{#iferror: {{#iferror:{{#invoke:Vorlage:FormatDate|Execute}}|}}
             | {{#if:  || }}Vorlage:Webarchiv/Wartung/Parameter{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Der Wert des Parameter 'archiv-datum' ist ungültig oder hat ein ungültiges Format.|1}}
          |  }} 
         | {{#if:  || }}Vorlage:Webarchiv/Wartung/Parameter{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Der Pflichtparameter 'archiv-datum' wurde nicht angegeben.|1}}
      }}
    | {{#if: 
         | {{#if:  || }}Vorlage:Webarchiv/Wartung/Parameter{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Der Parameter 'archiv-datum' ist nur in Verbindung mit 'archiv-url' angebbar.|1}}
      }}
  }}{{#if:{{#invoke:URLutil|isHostPathResource|http://hocr.berlios.de/documentation/html/index.html}}
    || {{#if:  || }}
  }}{{#if: hocr.berlios.de/documentation/html
    | {{#if: {{#invoke:WLink|isBracketedLink|hocr.berlios.de/documentation/html}}
        | {{#if:  || }}
      }}
    | {{#if:  || }}Vorlage:Webarchiv/Wartung/Linktext_fehlt
  }}{{#switch: 
    |addlarchives|addlpages= {{#if:  || }}{{#if: 1 |Vorlage:Webarchiv/Wartung/Parameter}}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: enWP-Wert im Parameter 'format'.|1}}
  }}{{#ifeq: {{#invoke:Str|find|http://hocr.berlios.de/documentation/html/index.html%7Carchiv}} |-1
    || {{#ifeq: {{#invoke:Str|find|{{#invoke:Str|cropleft|http://hocr.berlios.de/documentation/html/index.html%7C4}}%7Chttp}} |-1
         || {{#switch: {{#invoke:Webarchiv|getdomain|http://hocr.berlios.de/documentation/html/index.html }}
              | abendblatt.de | daserste.ndr.de | inarchive.com | webcitation.org = 
              | #default = {{#if:  || }}{{#if: 1 |Vorlage:Webarchiv/Wartung/URL}}{{#invoke:TemplUtl|failure| Fehler bei Vorlage:Webarchiv: Archiv-URL im Parameter 'url' anstatt URL der Originalquelle. Entferne den vor der Original-URL stehenden Mementobestandteil und setze den Archivierungszeitstempel in den Parameter 'wayback', 'webciteID', 'archive.today' oder 'archive-is' ein, sofern nicht bereits befüllt.|1}}
            }} 
       }}
  }}</ref> Anfang Dezember 2005 wurde hocr 0.4.6 in den unstable-Zweig der Linux-Distribution Debian aufgenommen<ref>packages.qa.debian.org/h/hocr/news/20051211T224905Z.html</ref> und im selben Monat in den testing-Zweig übernommen<ref>packages.qa.debian.org/h/hocr/news/20051223T220806Z.html</ref>; in Ubuntu finden sich hocr-Pakete ab der Version vom Juni 2006 (Dapper Drake).<ref>launchpad.net/ubuntu/+source/hocr</ref>

Weblinks

[{{canonicalurl:Commons:Category:{{#if:HOCR|HOCR|HebOCR}}|uselang=de}} Commons: {{#if:|{{{2}}}|{{#if:HOCR|HOCR|{{#invoke:WLink|getArticleBase}}}}}}]{{#switch:1

|X|x= |0|-= |S|s= – Sammlung von Bildern |1|= – Sammlung von Bildern{{#if:

    | {{#switch: {{#invoke:TemplUtl|faculty|1}}/{{#invoke:TemplUtl|faculty|1}}
        |1/=  und Videos
        |1/1=, Videos und Audiodateien
        |/1=  und Audiodateien}}
    | , Videos und Audiodateien
  }}

|#default= – }}{{#if: HOCR

   | {{#ifeq: {{#invoke:Str|left|hocr|9}} 
       | category: 
| FEHLER: Ohne Category: angeben!}}}}

Vorlage:Wikidata-Registrierung

Einzelnachweise

<references />