Go Back   Forum > Полезный софт > Работа с текстами
Работа с текстами Здесь лежат самые лучшие программы для редактирования и просмотра текстовых файлов разного формата
Closed Thread
 
LinkBack Thread Tools Display Modes
Old 05.01.2008   #1 (permalink)
Участник проекта OpenTTD 32bpp
 
Sergej_Sim's Avatar
 
Join Date: 30.09.2007
Posts: 2,009
Моя страна
Город : Мой город
Rep Power: 10
Sergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспорима
Send a message via ICQ to Sergej_Sim Send a message via Skype™ to Sergej_Sim
Hieroglyph 3.7

15 Октября 2001 года выпущен Hieroglyph 3.7 (Build 37)

Текстовый редактор Иероглиф является на сегодняшний день единственным редактором серьезно ориентированным на работу с русскими текстами с таким обширным набором функций (порядка 30) при совсем небольшом размере (порядка 3 MB в архиве). Иероглиф может использоваться как редактор по умолчанию вместо Notepad и Wordpad. Иероглиф является хорошим дополнением к Microsoft Word. Иероглиф также заменит вам все ваши программы перекодировки, работы с испорченной почтой, работы с UNICODE и решит все проблемы русификации.
К числу уникальных функций редактора относятся:
  • Практически безошибочный перевод транслитерированного текста в кириллицу.
  • Правильный перевод кириллицы в транслит с учетом русскоязычного написания англоизмов, имен и сокращений.
  • Авто-переключение раскладки клавиатуры. Забудьте про переключатель языка. Иероглиф определяет на каком языке вы пишете (русский или английский) и сам переключает клавиатуру.
  • Проверка правописания в интерактивном и автоматическом режиме. Автоматическая подсказка при наборе текста.
  • Тезаурус (словарь синонимов)
  • Переформатирование старых текстов с жесткими переносами и выравниванием. Убирание переносов внутри слов. Убирание HTML-тегов из текста.
  • Перекодировка WIN, KOI, ISO, DOS, MAC, а также перевод писем пришедших в семибитном текстовом виде (например =A7=B0=D9=FF) и перевод из UNICODE в ANSI и обратно.
  • Быстрое раскодирование многократно закодированных писем до 6-ти уровней вложенности.
  • Коррекция текста пропущенного через программы распознавания CuneiForm, OmniPage и др. Также исправляет типографские ошибки в любом тексте + находит латинские буквы в русских словах и т.д.
  • Таблица символов, виртуальная клавиатура, графический калькулятор
  • Иероглиф позволяет исполнять большинство своих функций по назначаемым горячим клавишам прямо в других программах.
  • Сохранение версий, получающихся при последовательной смене кодировок. Возможность просмотра и возврата к любой версии. Возможность визуального сравнения текущего текста с любой из предыдущих версий.
  • Экспортирование и импортирование всех установленных в вашей системе текстовых форматов. Если у вас установлен Microsoft Office, то их более пятнадцати.
  • Режим сбора информации, попадающей в буфер обмена (clipboard). В этом режиме любой текст, попадающий в буфер, добавляется к содержимому редактора.
  • Работа со списками и словарями, сортировка и фильтрация.
  • Поддержка всех основных возможностей форматирования текста, выравнивание, отступы, Drag&Drop файлов и выделенных блоков, возможность неограниченного отката и повтора на все операции (Undo & Redo), картинки в тексте, объекты и т.д.
  • Улучшенный диалог Поиска и Замены с возможностями пошагового поиска в обоих направлениях и замены с сохранением регистра букв и подсветкой замен. Уникальная возможность замены по списку с учетом задаваемых правил и условий.
  • ... и многое другое.
Новое в версии 3.7
Реализована полная совместимость со спецификациями RichEdit 3.0. Новые функции вызываются с панелей инструментов (toolbars) -
  • Выравнивание текста по ширине (justify),
  • Нумерованные списки,
  • Масштабирование (zoom).
  • Настраиваемое расстояние между строками (line spacing)
  • Разные стили подчеркивания.
В корне переделана функция сортировки списков:
  • Сильно увеличена скорость сортировки.
  • Возможна сортировка текстовых файлов без открывания в редакторе (особенно полезно для крупных файлов)
  • Поддержка UNICODE и сортировки по любым языкам (независимо от выбранного языка системы)
  • Добавлена возможность сортировки по длине слова и в обратном порядке
Прекращено использование спелл-чекеров Microsoft. Теперь Иероглиф поставляется со своим спелл-чекером, который:
  • примерно от 20% до 50% быстрее (зависит от языка и количества словарей) и содержат больше слов.
  • позволяют работать с несколькими словарями в каждом языке.
  • помимо привычного интерактивного режима, имеет автоматический режим, в котором все ошибки накапливаются в списке. В этом режиме можно автоматически добавлять часто повторяющиеся незнакомые слова в словарь пользователя и не считать их ошибочными.
  • показывает вероятные опечатки в ПРАВИЛЬНЫХ словах. То есть показывает те слова, которые могли получиться в результате попадания в соседнюю клавишу, при неправильном порядке ввода букв или при совершении распространенных ошибок. Например "ложка - лодка", "томится - томиться" и т.д.
  • подсвечивает измененные буквы в предлагаемых вариантах.
  • имеет улучшенную форму добавления слов в словари пользователя и поддерживает разные словари пользователя для разных языков.
  • позволяет регулировать разрешение замены буквы "ё" на "е" и использование Британского и Американского написания английских слов.
Другие новые возможности -
  • Цвет фона окна можно задавать через меню <Вид | Цвет фона>
  • Несколько функций добавлено в .
  • Добавлена возможность "Поиск в Интернете" (Internet Lookup), позволяющая запускать поиск выбранного слова в разных поисковых системах из контекстного меню по правой кнопки мыши. Можно настроить запуск любых сайтов, например обращение к словарю рифм или к толковому online-словарю. Настройка - в новом системном файле в <Файл | Системные Файлы | Поиск в Интернете>
On October, 15th, 2001 it is let out Hieroglyph 3.7 (Build 37)

The text editor the Hieroglyph is for today the unique editor seriously focused on job with Russian texts with such extensive set of functions (an order 30) at absolutely small size (an order 3 MB in archive). The hieroglyph can be used as the editor by default instead of Notepad and Wordpad. The hieroglyph is good addition to Microsoft Word. The hieroglyph also will replace to you all your programs of code conversion, job with spoilt mail, jobs with UNICODE and will solve all problems of russification.
Number of unique functions of the editor concern:

* practically faultless transfer of the transliterated text in Cyrillics.
* Cyrillics Correct translation in translit taking into account a Russian-speaking writing of English names and reductions.
* Avto-switching of an apportion of the keyboard. Forget about the language switch. The hieroglyph defines in what language you write (Russian or English) and itself switches the keyboard.
* Spelling in an interactive and automatic mode. The automatic help at typing.
* the Thesaurus (the dictionary of synonyms)
* Reformatting of old texts with rigid carryings over and alignment. Removal of carryings over in words. Cleaning HtMl-tegov from the text.
* Code conversion WIN, KOI, ISO, DOS, MAC, and also a translation of letters come to a seven-bit text kind (for example =A7=B0=D9=FF) and transfer from UNICODE in ANSI and back.
* Fast decoding of repeatedly coded letters to 6 levels of an enclosure.
* Correction of the text of recognition CuneiForm passed through programs, OmniPage, etc. Also corrects typographical errors in any text + finds Latin letters in Russian words etc.
* the Table of symbols, the virtual keyboard, the graphic calculator
* the Hieroglyph allows to execute the majority of the functions on appointed hotkeys directly in other programs.
* Preservation of the versions which are turning out at consecutive change of codings. Viewing and return possibility to any version. Possibility of visual comparison of the current text from any of the previous versions.
* Export and importation of all text formats established in your system. If at you it is established Microsoft Office, them more than fifteen.
* the Mode of gathering of the information getting to a clipboard (clipboard). In this mode any text getting to the buffer, is added to contents of the editor.
* Job with lists and dictionaries, sorting and a filtration.
* Support of all basic possibilities of formatting of the text, alignment, spaces, Drag&Drop files and the allocated blocks, possibility of unlimited recoil and repetition on all operations (Undo and Redo), pictures in the text, objects etc.
* the Improved dialogue of Search and Replacement with possibilities of step-by-step search in both directions and replacements with preservation of the register of letters and illumination of replacements. Unique possibility of replacement under the list taking into account set rules and conditions.
*... And many other things.

New in version 3.7
Full compatibility with specifications RichEdit 3.0 is realised. New functions are called from toolbars (toolbars) -

* text Alignment on width (justify),
* Numbered lists,
* Scaling (zoom).
* the Adjusted distance between lines (line spacing)
* Different styles of underlining.

In a root function of sorting of lists is altered:

* speed of sorting is strongly increased.
* sorting of text files without opening in the editor (it is especially useful for large files) Is possible
* Support UNICODE and sortings according to any languages (irrespective of the chosen language of system)
* possibility of sorting according to length of a word and upside-down Is added

Use spell-chekerov Microsoft is stopped. Now the Hieroglyph is delivered with the spell-chekerom, which:

* approximately from 20 % to 50 % faster (depends on language and quantity of dictionaries) and contain more words.
* allow to work with several dictionaries in each language.
* besides a habitual interactive mode, has an automatic mode in which all errors collect in the list. In this mode it is possible to add automatically often repeating unfamiliar words in the dictionary of the user and not to consider their erroneous.
* shows probable typing errors in CORRECT words. That is shows those words which could turn out as a result of hit in the next key, at a wrong order of input of letters or at fulfilment of widespread errors. For example "the spoon - a boat", "pines - to pine" etc.
* highlights the changed letters in offered variants.
* has the improved form of addition of words in dictionaries of the user and supports different dictionaries of the user for different languages.
* allows to regulate the permission of replacement of the letter "ё" on "е" and use of the British and American writing of English words.

Other new possibilities -

* Colour of a background of a window can be set through the menu <the Kind | Colour of a background>
* Some functions are added century
* possibility "Search on the Internet" Is added (Internet Lookup), allowing to start search of the chosen word in different search engines from the contextual menu on the right buttons of the mouse. It is possible to adjust start of any sites, for example the reference to the dictionary of rhymes or to the sensible online-dictionary. Adjustment - in a new system file in <the File | System Files | Search on the Internet>

Am 15. Oktober 2001 ist Hieroglyph 3.7 (Build 37) ausgegeben

Das Textverarbeitungsprogramm die Hieroglyphe ist für heute ein einziger Editor ernst ausgerichtet auf die Arbeit mit den russischen Texten mit solchem umfangreichen Satz der Funktionen (etwa 30) beim ganz kleinen Umfang (etwa 3 MB im Archiv). Die Hieroglyphe kann wie der Editor standardmäßig anstelle Notepad und Wordpad verwendet werden. Die Hieroglyphe ist eine gute Ergänzung zu Microsoft Word. Die Hieroglyphe wird Ihnen alle Ihre Programme der Umkodierung, der Arbeit mit der beschädigten Post auch ersetzen, die Arbeiten mit UNICODE wird alle Probleme der Russifizierung eben entscheiden.
Zur Zahl der einzigartigen Funktionen des Editors verhalten sich:

* die Tatsächlich fehlerfreie Übersetzung translit des Textes in die kyrillische Schrift.
* die Richtige Übersetzung der kyrillischen Schrift in translit unter Berücksichtigung der russischsprachigen Schreibung der englischen Namen und der Abkürzungen.
* die Auto-Umschaltung der Verteilung der Tastatur. Vergessen Sie über den Umschalter der Sprache. Die Hieroglyphe bestimmt auf welcher Sprache Sie Sie schreiben (der Russe oder die englische Sprache) und selbst schaltet die Tastatur um.
* die Prüfung der Rechtschreibung im interaktiven und automatischen Regime. Der automatische Hilfebefehl beim Satz des Textes.
* den Thesaurus (das Wörterbuch der Synonyme)
* das Umformatieren der alten Texte mit den harten Übertragungen und der Ausrichtung. Das Löschen der Übertragungen innerhalb der Wörter. Das Reinigen HtMl-tegov aus dem Text.
* die Umkodierung WIN, KOI, ISO, DOS, MAC, sowie die Übersetzung der Briefe kommend zu sieben Bit die Textart (zum Beispiel =A7=B0=D9=FF) und die Übersetzung aus UNICODE in ANSI und zurück.
* das Schnelle Dekodieren der vielfach verschlüsselten Briefe bis zu 6.ти der Verschachtelungsebenen.
* korrigiert die Korrektion des Textes der Erkennung durch der Programme versäumten CuneiForm, OmniPage u.a. die typographischen Fehler in einem beliebigen Text + Auch findet die lateinischen Buchstaben in den russischen Wörtern usw.
* die Tabelle der Symbole, die virtuelle Tastatur, den graphischen Rechner
* lässt die Hieroglyphe zu, die Mehrheit der Funktionen nach den ernannten Shortcuts zu erfüllen ist in anderen Programmen gerade.
* die Sicherung der Versionen, die sich beim konsequenten Wechsel der Kodierungen ergeben. Die Möglichkeit der Durchsicht und der Rückgabe zu einer beliebigen Version. Die Möglichkeit des visualen Vergleiches des laufenden Textes von jeder der vorhergehenden Versionen.
* das Exportieren und das Importieren aller in Ihr System bestimmten Textformate. Wenn bei Ihnen Microsoft Office, so sie bestimmt ist.
* das Regime der Datenerfassung, geratend in die Zwischenablage (clipboard). In diesem Regime wird der beliebige Text, der in den Puffer gerät, zum Inhalt des Editors ergänzt.
* die Arbeit mit den Listen und den Wörterbüchern, die Sortierung und die Filtrierung.
* die Unterstützung aller Hauptmöglichkeiten der Textformatierung, die Ausrichtung, die Einzüge, Drag&Drop der Dateien und der markierten Blöcke, die Möglichkeit des unbeschränkten Rücklaufes und der Wiederholung auf alle Operationen (Undo und Redo), des Bildes im Text, die Objekte usw.
* den Verbesserten Dialog der Suche und des Ersetzens mit den Möglichkeiten der schrittweisen Suche in beiden Richtungen und die Ersetzen mit der Sicherung des Registers der Buchstaben und der Hervorhebung der Ersetzen. Die einzigartige Ersetzbarkeit nach der Liste unter Berücksichtigung der aufgegebenen Regeln und der Bedingungen.
*... Und anderes.

Neu in die Versionen 3.7
Es ist die volle Vereinbarkeit mit den Spezifikationen RichEdit 3.0 realisiert. Die neuen Funktionen melden sich von den Funktionsleisten (toolbars) -

* die Ausrichtung des Textes nach der Breite (justify),
* die Numerierten Listen,
* die Skalierung (zoom).
* die Angepaßte Entfernung zwischen den Zeilen (line spacing)
* Verschiedene Stile der Unterstreichung.

In der Wurzel ist die Funktion der Sortierung der Listen geändert:

* ist die Geschwindigkeit der Sortierung stark vergrössert.
* Ist die Sortierung der Textdateien ohne Aufmachen im Editor (Möglich es ist für die grossen Dateien besonders nützlich)
* die Unterstützung UNICODE und die Sortierungen nach beliebigen Sprachen (unabhängig von der ausgewählten Sprache des Systems)
* Ist die Möglichkeit der Sortierung nach der Wortlänge und in der Rückordnung Beigefügt

Es ist die Nutzung spell-chekerov Microsoft aufgehört. Jetzt wird die Hieroglyphe mit spell-chekerom, der geliefert:

* ungefähr von 20 % bis zu 50 % ist schneller (hängt von der Sprache und der Zahl der Wörterbücher) ab und enthalten mehr Wörter.
* lassen zu, mit einigen Wörterbüchern in jeder Sprache zu arbeiten.
* außer dem gewohnheitsmäßigen interaktiven Betrieb, hat das automatische Regime, in dem alle Fehler in der Liste angesammelt werden. In diesem Regime kann man die oft wiederholten unbekannten Wörter ins Wörterbuch des Benutzers automatisch ergänzen, für ihre falsch nicht zu halten.
* führt die wahrscheinlichen Druckfehler in den RICHTIGEN Wörtern vor. Das heißt führt jene Wörter, die sich im Ergebnis des Treffens in die benachbarte Taste ergeben konnten, bei der falschen Ordnung der Einführung der Buchstaben oder bei der Vollziehung der verbreiteten Fehler vor. Zum Beispiel "wird der Löffel - das Boot", "gequält -" usw. gequält zu werden
* hebt die geänderten Buchstaben in den angebotenen Varianten hervor.
* hat die verbesserte Form der Ergänzung der Wörter in die Wörterbücher des Benutzers und unterstützt verschiedene Wörterbücher des Benutzers für verschiedene Sprachen.
* lässt zu, die Auflösung des Ersetzens des Buchstabens "ё" auf "е" und die Nutzung der Britischen und Amerikanischen Schreibung der englischen Wörter zu regulieren.

Andere neue Möglichkeiten -

* kann die Hintergrundfarbe des Fensters durch das Menü <die Art | die Hintergrundfarbe> aufgeben
* sind Etwas Funktion das Jh. beigefügt
* Ist die Möglichkeit "die Suche im Internet" (Internet Lookup), zulassend Beigefügt, die Suche des ausgewählten Wortes in verschiedenen Suchsystemen aus dem kontextabhängigen Menü auf den rechten Maustasten auszuführen. Man kann das Starten beliebiger Standorte, zum Beispiel die Behandlung am Wörterbuch der Reime oder zum gescheiten online-Wörterbuch anpaßen. Die Anpassung - in der neuen Systemdatei in <die Datei | die Systemdateien | die Suche im Internet>
__________________

Last edited by Sergej_Sim; 05.01.2008 at 10:01.
Sergej_Sim is offline  
Digg this Post!Delicious this Post!Technorati this Post!Google this Post!Slashdot this Post!Reddit! Furl this Post!Diigo this Post!StumbleUpon this Post!Simply this Post!Blink this Post!Spurl this Post!Magnolia this Post!Newsvine this Post!Bibsonomy this Post!Wong this Post!Yahoo this Post!Feedmelinks this Post!Bookmarktracker this Post!Backflip this Post!Mylinkvault this Post!Netscape this Post!Buddymark this Post!
Old 05.01.2008   #2 (permalink)
Участник проекта OpenTTD 32bpp
 
Sergej_Sim's Avatar
 
Join Date: 30.09.2007
Posts: 2,009
Моя страна
Город : Мой город
Rep Power: 10
Sergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспорима
Send a message via ICQ to Sergej_Sim Send a message via Skype™ to Sergej_Sim

ОПИСАНИЕ ПРОГРАММЫ

Насколько хорош Иероглиф?

Иероглиф является первым и последним бесплатным редактором с таким широким набором функций при таком небольшом размере. Иероглиф нельзя сравнивать с другими редакторами по той простой причине, что он уникален в своем классе. Это первая в мире программа направления авто-редактор, позволяющая автоматически переключать раскладку клавиатуры при печати, автоматически предлагать варианты исправления слов с ошибками, автоматически проверять и исправлять испорченные тексты, автоматически переформатировать старые тексты с жесткими переносами и выравниванием, безошибочно переводить транслит в кириллицу, исполнять многие функции по горячим клавишам в других приложениях и многое другое. В основе редактора лежит более 50 алгоритмов искусственного интеллекта, каждый из которых мог быть воплощен в отдельной программе. Причем в коммерческой программе. Но Иероглиф бесплатен. Что к этому можно еще добавить?

Чем Иероглиф отличается от других редакторов?

Основным достоинством редактора "Иероглиф" и других наших программ является наличие Hieroglyph Translation Engine (в дальнейшем просто "Иероглиф"). Иероглиф - это мощный блок функций осуществляющих осмысленную конверсию между разными стилями написания слов. Если взять к примеру русское слово "щучий" и попробовать написать его разными способами, то можно получить такие варианты: щучий, shuchii, tshuchiy, tschuchy, shuchiy, LIIy4uu, LIIychiy и т.д. Число вариантов написания некоторых слов может быть очень большим. Но несмотря на это, человек легко читает слова в любом написании. Обычный редактор конечно же не может увидеть в этом наборе букв слово. Иероглиф - может!!!

Как это делают другие?

Другие программы перекодировки из транслита в кириллицу используют длинные грамматики, составленные человеком и описывающие аномалии перевода. Например последовательность sh может переводиться как "ш", "щ" и "сх" в зависимости от положения в слове и окружающих букв. Эти особенности анализируются и записываются в виде правил и исключений. По мере появления новой информации грамматика пополняется новыми правилами. Очевидный недостаток такого подхода - это необходимость помнить предыдущие правила в грамматике, чтобы новые правила не конфликтовали со старыми и не возникало двусмысленных переводов. Другой недостаток - грамматика с каждым дополнением становится лучше и лучше но никогда не достигает идеала. При этом она сильно растет и это сказывается на скорости обработки текста. Представьте себе просмотр нескольких тысяч правил на каждом слове и вы поймете почему процесс может быть достаточно медленным. Конечно есть алгоритмы оптимизации поиска, позволяющие добиться приемлемой скорости, но сам подход к решению задач трудно назвать универсальным. Ведь разработка грамматики становится целым проектом для каждого нового языка.

Как это делаем мы?

Уникальность алгоритмов Иероглифа состоит в копировании интеллекта человека при распозновании образа. Иероглиф как и человек оперирует тремя понятиями -
1. он знает, как выглядят и пишутся буквы,
2. он знает какие сочетания букв имеют смысл в каком языке
3. он знает какие слова есть в каких языках.
Если рассматривать эти три составляющие по отдельности, то первая представляет из себя около 200 коротких правил описывающих 33 буквы русского алфавита в разных способах написаниях, второе - это бинарный файл размером около 30 КБ полученный на основе автоматического анализа большого числа разных текстов (в данном случае была взята Библиотека Мошкова - около миллиона слов). Только вдумайтесь - больше чем 1 Гигабайта информации оказалось сжато в 30 килобайт. В интеллекте человека происходит что-то подобное. Если у вас спросить может ли буква "м" быть в слове между буквами "ш" и "щ" вы не станете перебирать в уме все слова языка. Вы сразу знаете ответ. Так же работает и Иероглиф. Он моментально определяет какие слова могут соответствовать написанию, а какие нет. Например слову schuchy может соответствовать слова "щучий" и "шучу", а слово "сцхусху" явно не вариант. Человеку нужна микросекунда, чтобы знать это. У Иероглифа это занимает не больше. Но человек определяет реальность слов не только по возможности их произношения. Для проверки выбора человек привлекает свое знание языка. Для Иероглифа знание языка заменяет стандартный спелл-чекер, который подсказывает, есть ли такое слово в языке. Таким образом Иероглиф точно копирует весь процесс мышления человека при обработке образа и практически не требует дальнейшей настройки и улучшения грамматики.

Неужели все так просто?

Процесс перевода перестает быть простым, когда в тексте начинают встречаться слова на другом языке, разные символы, сокращения, имена файлов, формулы, римские цифры и прочие неучтенные спелл-чекером аномалии. Здесь вступают в работу другие алгоритмы, помогающие отфильтровать такие аномалии и оставлять их непереведенными. Для отлавливания английских слов тоже используется спелл-чекер.
Пытливый читатель может спросить - а что делать, если слово есть и в русском и в английском языке? Например слово "net" означает в английском "сеть". Переводить его в русское слово "нет" или оставить как есть? Здесь на помощь приходит анализ контекста фразы. Выясняется какие слова стоят вокруг и делает правильный выбор.
Вот пример перевода текста из транслита в кириллицу, сделанный обычными методами и с привлечением Иероглифа:

Исходный текст:Privet! Ia tut nedavno nashel ves'ma prikolnuu programmy Hieroglyph . Ona pozvoliaet perevodit' teksty iz translita v cyrillitsu virtually flawless

Текст после перевода обычным переводчиком:Привет! Я тут недавно нашел весьма приколнуу программы Хиероглипх . Она позволиает переводить тексты из транслита в цыриллитсу виртуалли флавлесс

Текст после перевода Иероглифом:Привет! Я тут недавно нашел весьма прикольную программу Hieroglyph . Она позволяет переводить тексты из транслита в кириллицу virtually flawless

А в чем, собственно, универсальность?

Иероглиф является мощным инструментом не только для перевода из транслита в кириллицу, но и позволяет работать над исправлением текстов испорченных ошибками набора или распознавания текста. Метафора человеческого интеллекта опять приходит в голову. Человек, видя слово "iiустота", моментально определяет, что двойная буква i в начале на самом деле русская буква "п", а в слове "прадва" буквы "д" и "в" поменяны местами. Аналогичный принцип "мышления" Иероглифа и здесь оказывается очень кстати.
Обучением Иероглифа обработке ошибок распознавания занимается Сергей Москалев - один из крупнейших специалистов по распознаванию сосканированных текстов, работавший над такими проектами, как распознавание Энциклопедического словаря Брокгауз, Интернет-проект "Брокгауз On-line", эксперт, знающий все известные программы распознавания текста и знающий какие ошибки они совершают.

Программа AfterScan

Программа AfterScan включает в себя огромный опыт специалистов помноженный на гибкость и универсальность алгоритмов Иероглифа. Даже первая бета-версия программы позволила легко найти в словаре ошибки не замеченные многочисленными корректорами. Другой пример - на распознанном одной из коммерческих программ тексте длиной в 10 страниц, AfterScan делает больше 3200 исправлений. И это после того, как программа распознавания пропустила текст через свои алгоритмы верификации и сравнила все со своим словарем. Представьте, что вы исправляете эти ошибки руками. Пусть исправление одной ошибки занимает 5 секунд. Помножьте 3200 на 5 и получите почти 5 часов напряженной работы и нечеловеческой концентрации. А сколько ошибок будет просто пропущено?
Вот фрагмент сосканированного и распознанного текста, после обработки программами Иероглиф и AfterScan. Слова с ошибками и старорусские слова выделены цветом:

Вот исходный текст:
Попудярная Библейская Эициклопедiя отв^чаетъ почти на большую
часть вопросовъ библейской археологiи, архитектуры, астрономiи,
географiи, бiографiи библейскихъ д^Ьятелей, ботаники, священной
библiографiи, военной науки, зоологiи, землед^лiя, искусствъ,
минералогiи, метеорологiи, медицины, математики, нумизматики,
педагогики, физики, этнографiи и друг. Богосдовскiе термины, за
исключенiемъ терминовъ строгобибдейскаго значенiя, опущены. Объясненiе
подробностей библейскихъ терминовъ касается какъ каноническихъ, такъ и
неканоническихъ книгъ Свящ. Писанiя, съ тбмъ однако что объясненiя
сихъ посл^днихъ отдичаются своею значительною краткостiю сравнительно
съ первыми.


Вот текст после обработки Иероглифом:

Попудярная Библейская Эициклопедия отвечает почти на большую часть
вопросов библейской археологии, архитектуры, астрономии, географии,
биографии библейских деятелей, ботаники, священной библиографии,
военной науки, зоологии, земледелия, искусств, минералогии,
метеорологии, медицины, математики, нумизматики, педагогики, физики,
этнографии и друг. Богословские термины, за исключением терминов
строгобиблейского значения, опущены. Объяснение подробностей
библейских терминов касается как канонических, так и неканонических
книг Свящ. Писания, с тем однако что объяснение сих последних
отдичаются своей значительною краткостию сравнительно с первыми.


и наконец, после обработки программой AfterScan:

Популярная Библейская Энциклопедия отвечает почти на большую часть
вопросов библейской археологии, архитектуры, астрономии, географии,
биографии библейских деятелей, ботаники, священной библиографии,
военной науки, зоологии, земледелия, искусств, минералогии,
метеорологии, медицины, математики, нумизматики, педагогики, физики,
этнографии и друг. Богословские термины, за исключением терминов
строгобиблейского значения, опущены. Объяснение подробностей
библейских терминов касается как канонических, так и неканонических
книг Свящ. Писания, с тем однако что объяснение сих последних
отличаются своей значительной краткостью сравнительно с первыми.


И ВСЕ ЭТО АВТОМАТИЧЕСКИ!!!
В данном примере приведен фрагмент текста в старорусской орфографии. На самом деле AfterScan может подчистить любой текст, даже многократно проверенный корректорами. AfterScan видит ошибки не заметные для глаз - использование латинских букв с одинаковыми начертанием в русских словах, лишние пробелы, несоответствия знаков препинания типографским нормам и т.д. Если Вы работает с большими массивами текста, часто используете программы распознавания, то вам необходим серьезный инструмент для работы. Таким инструментом является AfterScan.
По вопросам приобретения обращайтесь по адресу
[Для просмотра ссылки ]
и заходите на
[Для просмотра ссылки ]


Я не работаю с распознаванием текстов. Как еще я могу извлечь пользу из Иероглифа?

Если вы любите IRC-чаты, то вам понравится другая наша программа IRC-3PO, осуществляющая синхронный перевод в между кириллицей и транслитом.. Программа названа в честь робота C-3PO из фильма "Звездные Войны", который как известно был универсальным переводчиком. Читайте об уникальных свойствах этой программы на ее страничке

Как выглядит Иероглиф?

Снизу - исходный текст, сверху - результат. Темно-синим цветом выделены однозначные замены. Голубым - неоднозначные, то есть те, которым соответствовало более одного правильного слова. Коричневый цвет показывает слова между которыми был убран дефис. Иероглиф сомневается в этой замене (и правильно делает). Поэтому слова выделены коричневым. В нижней части окна видно часть исходного текста в позиции курсора (как раз на слове "бело-светло".

THE PROGRAM DESCRIPTION

The Hieroglyph is how much good?

The hieroglyph is first and last free editor with such wide set of functions at such small size. The hieroglyph cannot be compared to other editors for that simple reason, that it is unique in the class. It is the first-ever program of a direction the auto-editor, allowing automatically to switch a keyboard apportion at the press, automatically to offer variants of correction of words with errors, automatically to check and correct the spoilt texts, automatically to reformat old texts with rigid carryings over and alignment, unmistakably to translate translit in Cyrillics, to execute many functions on hotkeys in other applications and many other things. At the heart of the editor lays more than 50 algorithms of an artificial intellect, each of which could be embodied in the separate program. And in the commercial program. But the Hieroglyph is free. What to it it is possible to add still?

Than the Hieroglyph differs from other editors?

The basic advantage of the editor "Hieroglyph" and other our programs is presence Hieroglyph Translation Engine (further simply "Hieroglyph"). The hieroglyph is a powerful block of functions carrying out intelligent conversion between different styles of a writing of words. If to take for example Russian word "pike" and to try to write in its different ways it is possible to receive such variants: pike, shuchii, tshuchiy, tschuchy, shuchiy, LIIy4uu, LIIychiy etc. the Number of variants of a writing of some words can be very big. But despite it, the person easily reads words in any writing. The usual editor certainly cannot see a word in this set of letters. The hieroglyph - can!!!

How it is done by others?

Other programs of code conversion from translit in Cyrillics use long the grammar, made by the person and describing anomalies of transfer. For example the sequence sh can be translated as "ш", "щ" and "сх" depending on position in a word and surrounding letters. These features are analyzed and register in the form of rules and exceptions. In process of occurrence of the new information the grammar replenishes with new rules. The obvious lack of such approach is a necessity to remember the previous rules in grammar that new rules did not clash with old and there were no ambiguous transfers. Other lack - grammar with each addition becomes better and better but never reaches an ideal. Thus it strongly grows also it affects speed of text processing. Imagine viewing of several thousand rules on each word and you will understand why process can be slow enough. Certainly there are algorithms of optimisation of the search, allowing to achieve comprehensible speed, but the approach to the decision of problems it is difficult to name the universal. After all grammar working out becomes the whole project for each modern language.

How it is done by us?

Uniqueness of algorithms of the Hieroglyph consists in copying of intelligence of the person at распозновании an image. The hieroglyph as well as the person operates with three concepts -

1. He knows, how look and letters are written,
2. He knows what combinations of letters make sense in what language
3. He knows what words is in what languages.

If to consider these three components separately the first is about 200 short rules of describing 33 letters of Russian alphabet in different ways a spelling, the second is a binary file in the size 30 KB received on the basis of the automatic analysis of the big number of different texts (in this case was Moshkov's Library - about one million words is taken). Only ponder - more than 1 Gigabyte of the information it has appeared it is compressed in 30 kilobyte. In intelligence of the person there is something similar. Whether if the letter "m" can ask you to be in a word between letters "ш" and "щ" you not begin to touch in mind all words of language. You know at once the answer. As the Hieroglyph works also. It instantly defines what words can correspond to a writing and what are not present. For example to a word schuchy can correspond words "pike" and I "joke", and the word "сцхусху" is obvious not a variant. The micro second is necessary to the person to know it. It occupies from the Hieroglyph no more. But the person defines a reality of words not only whenever possible their pronunciations. For check of a choice the person involves the knowledge of language. For the Hieroglyph the knowledge of language replaces standard spell-cheker which prompts, whether there is such word in language. Thus the Hieroglyph precisely copies all process of thinking of the person at processing of an image and practically does not demand the further adjustment and grammar improvement.

Really all so is simple?

Translation process ceases to be simple when in the text words in other language start to meet, different symbols, reductions, names of files, formulas, the Roman figures and other not considered spell-chekerom anomalies. Other algorithms Here enter job, helping to filter such anomalies and to leave their not translated. For отлавливания English words too it is used spell-cheker.
The inquisitive reader can ask - and what to do, if the word is both in Russian and in English language? For example the word "net" means in English "network". To translate it in Russian word "is not present" or to leave as is? Here the analysis of a context of a phrase to the aid comes. It is found out what words stand around and makes a correct choice.
Here an example of text translation from translit in Cyrillics, made usual methods and with Hieroglyph attraction:

Initial текст:Privet! Ia tut nedavno nashel ves'ma prikolnuu programmy Hieroglyph. Ona pozvoliaet perevodit ' teksty iz translita v cyrillitsu virtually flawless

The text after transfer usual переводчиком:Привет! I here have found recently rather приколнуу programs Хиероглипх. It позволиает to translate texts from translit in цыриллитсу виртуалли флавлесс

The text after transfer Иероглифом:Привет! I here have found recently rather cool program Hieroglyph. She allows to translate texts from translit in Cyrillics virtually flawless

And in what, actually, universality?

The hieroglyph is the powerful tool not only for transfer from translit in Cyrillics, but also allows to work over correction of texts of the set spoilt by errors or text recognition. The metaphor of human intelligence again comes to mind. The person, seeing a word "iiустота", instantly defines, that the double letter i in the beginning actually Russian letter "п", and in a word "прадва" letters "д" and "in" are changed by places. The similar principle of "thinking" of the Hieroglyph here again appears very opportunely.
To processing of errors of recognition Sergey Moskalev - one of the largest experts in recognition сосканированных the texts, working over such projects as recognition of the Encyclopaedic dictionary Brockhaus, the Internet project "Brockhaus On-line", the expert knowing all known programs of recognition of the text and knowing what errors they make is engaged in training of the Hieroglyph.

Program AfterScan

Program AfterScan includes huge experience of experts multiplied by flexibility and universality of algorithms of the Hieroglyph. Even the first beta version of the program has allowed to find easily in the error dictionary not noticed by numerous proof-readers. Other example - on distinguished by one of commercial programs the text in length 10 pages, AfterScan does more than 3200 corrections. And it after the recognition program has passed the text through the algorithms of verification and has compared all to the dictionary. Present, that you correct these errors hands. Let correction of one error occupies 5 seconds. Multiply 3200 on 5 and receive almost 5 hours of hard work and inhuman concentration. And how much errors will be simply passed?
Here a fragment сосканированного and the distinguished text, after processing by programs the Hieroglyph and AfterScan. Words with errors and Old Russian words are allocated by colour:

Here the initial text:
Попудярная Bible Эициклопедiя отв^чаетъ almost on the big
Part вопросовъ bible археологiи, architecture, астрономiи,
географiи, бiографiи библейскихъ д^Ьятелей, botany, sacred
библiографiи, a military science, зоологiи, землед^лiя, искусствъ,
минералогiи, метеорологiи, medicine, mathematics, numismatics,
Pedagogics, physicists, этнографiи and the friend. Богосдовскiе terms, for
исключенiемъ терминовъ строгобибдейскаго значенiя, are lowered. Объясненiе
Details библейскихъ терминовъ concerns какъ каноническихъ, такъ and
неканоническихъ книгъ Свящ. Писанiя, съ тбмъ however that объясненiя
сихъ посл^днихъ отдичаются своею значительною краткостiю rather
съ the first.

Here the text after processing by the Hieroglyph:

Попудярная Bible Эициклопедия responds almost to the most part
Questions of bible archeology, architecture, astronomy, geography,
Biographies of bible figures, botany, the sacred bibliography,
Military science, zoology, agriculture, arts, mineralogy,
Meteorologies, medicine, mathematics, numismatics, pedagogics, physics,
Ethnographies and the friend. Theological terms, except for terms
строгобиблейского values, are lowered. An explanation of details
Bible terms concerns both initial, and not initial
Books Свящ. The writing, with that however that an explanation of these last
отдичаются the значительною краткостию compared with the first.

And at last, after processing by program AfterScan:

The popular Bible Encyclopedia responds almost to the most part
Questions of bible archeology, architecture, astronomy, geography,
Biographies of bible figures, botany, the sacred bibliography,
Military science, zoology, agriculture, arts, mineralogy,
Meteorologies, medicine, mathematics, numismatics, pedagogics, physics,
Ethnographies and the friend. Theological terms, except for terms
строгобиблейского values, are lowered. An explanation of details
Bible terms concerns both initial, and not initial
Books Свящ. The writing, with that however that an explanation of these last
Differ the considerable brevity compared with the first.

AND ALL IT AUTOMATICALLY!!!
In the given example the text fragment in Old Russian spelling is resulted. Actually AfterScan can clean any text which even has been repeatedly checked up by proof-readers. AfterScan sees errors not appreciable for eyes - use of Latin letters with identical a tracing in Russian words, superfluous blanks, discrepancies of punctuation marks to typographical norms etc. If you works with the big files of the text, often use recognition programs the serious tool is necessary for job for you. Such tool is AfterScan.

I do not work with recognition of texts. How still I can benefit by the Hieroglyph?

If you like IRC-chats you will like other our program IRC-3PO which is carrying out simultaneous interpretation in between Cyrillics and translit. The Program is named in honour of robot C-3PO from a film "Star Wars" which as is known was the universal translator. Read about unique properties of this program on its page

How the Hieroglyph looks?

From below - the initial text, from above - result. Dark blue colour allocates unequivocal replacements. Blue - ambiguous, that is to what corresponded more than one correct word. Brown colour shows words between which the hyphen has been cleaned. The hieroglyph doubts this replacement (and correctly does). Therefore words are allocated by the brown. In the bottom part of a window it is visible a part of the initial text in a cursor position (just on a word "is white-is light".

DIE PROGRAMMBESCHREIBUNG

Inwiefern die Hieroglyphe gut ist?

Die Hieroglyphe ist der erste und letzte kostenlose Editor mit solchem breiten Satz der Funktionen bei solchem kleinen Umfang. Die Hieroglyphe darf man nicht mit anderen Editoren aus jenem einfachem Grund vergleichen, dass er in der Klasse einzigartig ist. Es ist erste in der Welt das Programm der Richtung der Auto-Editor, zulassend automatisch, die Verteilung der Tastatur bei der Presse umzuschalten, die Varianten der Korrektur der Wörter mit den Fehlern automatisch anzubieten, automatisch zu prüfen und die beschädigten Texte zu korrigieren, die alten Texte mit den harten Übertragungen und der Ausrichtung automatisch umzuformatieren, транслит in die kyrillische Schrift fehlerfrei zu übersetzen, viele Funktionen nach den Shortcuts in anderen Anwendungen und anderes zu erfüllen. Zugrunde des Editors liegt mehr 50 Algorithmen der künstlichen Intelligenz, jeder von denen konnte im abgesonderten Programm verwirklicht sein. Wobei im kommerziellen Programm. Aber die Hieroglyphe бесплатен. Was man dazu noch ergänzen kann?

Als die Hieroglyphe unterscheidet sich von anderen Editoren?

Eine Hauptwürde des Editors "Hieroglyphe" und unserer anderen Programme ist das Vorhandensein Hieroglyph Translation Engine (es ist "die Hieroglyphe" im Folgenden einfach). Die Hieroglyphe ist ein mächtiger Block der Funktionen verwirklichend die bewusste Konversion zwischen verschiedenen Stilen der Schreibung der Wörter. Wenn zum Beispiel das russische Wort "щучий" zu nehmen und, zu versuchen, in seinen verschiedenen Weisen zu schreiben, so kann man solche Varianten bekommen: щучий, shuchii, tshuchiy, tschuchy, shuchiy, LIIy4uu, LIIychiy usw. kann die Zahl der Varianten der Schreibung einiger Wörter sehr groß sein. Aber ungeachtet seiner, der Mensch liest die Wörter in einer beliebigen Schreibung leicht. Der gewöhnliche Editor natürlich kann in diesem Satz der Buchstaben das Wort nicht sehen. Die Hieroglyphe - kann!!!

Wie es andere machen?

Andere Programme der Umkodierung aus транслита in die kyrillische Schrift verwenden die langen Grammatiken, die gebildeten vom Menschen und die Anomalien der Übersetzung beschreiben. Zum Beispiel kann die Reihenfolge sh wie "ш", "щ" und "сх" je nach der Lage im Wort und der umgebenden Buchstaben übersetzt werden. Diese Besonderheiten werden analysiert eben werden in Form von den Regeln und den Ausnahmen gespeichert. Je nach dem Erscheinen der neuen Informationen wird die Grammatik von den neuen Regeln ergänzt. Der offensichtliche Mangel solchen Herangehens ist sich eine Notwendigkeit die vorhergehenden Regeln in der Grammatik zu erinnern, damit die neuen Regeln mit den Alten nicht stritten entstand der zweideutigen Übersetzungen nicht. Anderer Mangel - die Grammatik mit jeder Ergänzung wird und besser besser sein aber niemals erreicht das Ideal. Dabei wächst sie auch es stark wirkt sich auf die Geschwindigkeit der Textbearbeitung aus. Stellen Sie sich die Durchsicht einiger Tausende Regeln auf jedem Wort vor und Sie werden verstehen warum kann der Prozess genügend langsam sein. Natürlich gibt die Algorithmen der Optimierung der Suche, zulassend, nach der annehmbaren Geschwindigkeit zu streben, aber das Herangehen an die Lösung der Aufgaben ist es schwierig, universell zu nennen. Doch wird die Entwicklung der Grammatik ein ganzes Projekt für jede neue Sprache.

Wie es wir machen?

Die Einmaligkeit der Algorithmen der Hieroglyphe besteht im Kopieren des Intellekts des Menschen bei распозновании der Weise. Die Hieroglyphe wie auch der Mensch operiert mit drei Begriffen -

1. Er weiß, wie aussehen und es werden die Buchstaben geschrieben,
2. Er weiß welche Kombinationen der Buchstaben haben den Sinn in welcher Sprache
3. Er weiß welche Wörter ist in welchen Sprachen.

Wenn diese drei Komponenten getrennt betrachten, so stellt erste von sich neben 200 kurzen Regeln beschreibender 33 Buchstaben des russischen Alphabetes in verschiedenen Weisen написаниях vor, ist zweite eine binäre Datei vom Umfang 30 Konstruktionsbüros bekommen aufgrund der automatischen Analyse der großen Zahl verschiedener Texte (es war die Bibliothek Moshkova - neben Million Wörter in diesem Fall genommen). Nur denken Sie sich - grösser hinein als 1 Gigabytes der Informationen zeigte es sich ist in 30 Kilobyte zusammengepresst. Im Intellekt des Menschen geschieht etwas ähnlich. Ob wenn Sie der Buchstabe "m" fragen kann, im Wort zwischen den Buchstaben "ш" und "щ" Sie zu sein werden im Verstand alle Wörter der Sprache nicht auslesen. Sie wissen die Antwort sofort. Ebenso arbeitet auch die Hieroglyphe. Er bestimmt welche Wörter augenblicklich können der Schreibung, und entsprechen welche es nicht gibt. Zum Beispiel kann dem Wort schuchy die Wörter "щучий" entsprechen und ich "scherze", und das Wort "сцхусху" ist nicht die Variante offenbar. Dem Menschen ist die Mikrosekunde nötig, um es zu wissen. Bei der Hieroglyphe nimmt es nicht mehr ein. Aber der Mensch bestimmt die Realität der Wörter nicht nur nach Möglichkeit ihre Aussprachen. Für die Prüfung der Auswahl zieht der Mensch das Wissen der Sprache heran. Für die Hieroglyphe ersetzt das Wissen der Sprache standardmäßig spell-cheker, der vorsagt, ob solches Wort in der Sprache gibt. So kopiert die Hieroglyphe den ganzen Prozess des Denkens des Menschen bei der Bearbeitung der Weise genau und tatsächlich fordert die weitere Anpassung und die Verbesserung der Grammatik nicht.

Wirklich ist aller so einfach?

Der Übersetzungsprozess hört auf, einfach zu sein, wenn im Text beginnen sich die Wörter auf anderer Sprache, verschiedene Symbole, die Abkürzungen, die Namen der Dateien, die Formelen, die römischen Zahlen und übrig nicht berücksichtigt spell-chekerom der Anomalie zu treffen. Hier betreten die Arbeit andere Algorithmen, helfend, solche Anomalien abzufiltern und davon nicht übersetzt zu lassen. Für отлавливания der englischen Wörter wird spell-cheker auch verwendet.
Der wissbegierige Leser kann - und was, zu machen, wenn das Wort sowohl im Russen als auch im Englische ist fragen? Zum Beispiel bedeutet das Wort "net" in der englischen Sprache "das Netz". Es ins russische Wort zu übersetzen "gibt es" oder, wie es ist zu lassen? Hier kommt die Analyse des Kontextes der Phrase zu Hilfe. Es stellt sich welche Wörter heraus stehen ringsumher und macht eine richtige Auswahl.
Das Beispiel der Übersetzung des Textes aus транслита in die kyrillische Schrift, gemacht die gewöhnlichen Methoden und mit der Heranziehung der Hieroglyphe:

Ausgangs-текст:Privet! Ia tut nedavno nashel ves'ma prikolnuu programmy Hieroglyph. Ona pozvoliaet perevodit ' teksty iz translita v cyrillitsu virtually flawless

Den Text nach der Übersetzung gewöhnlich переводчиком:Привет! Ich habe sehr приколнуу die Programme Хиероглипх hier vor kurzem gefunden. Sie позволиает die Texte aus транслита in цыриллитсу виртуалли флавлесс zu übersetzen

Den Text nach der Übersetzung Иероглифом:Привет! Ich habe das sehr witzige Programm Hieroglyph hier vor kurzem gefunden. Sie lässt zu, die Texte aus транслита in die kyrillische Schrift virtually flawless zu übersetzen

Und in als eigentlich die vielseitige Anwendbarkeit?

Die Hieroglyphe ist ein mächtiges Tool nicht nur für die Übersetzung aus транслита in die kyrillische Schrift, sondern auch lässt zu, an der Korrektur der Texte beschädigt von den Fehlern des Satzes oder der Erkennung des Textes zu arbeiten. Die Metapher des menschlichen Intellekts kommt zum Kopf wieder. Der Mensch, das Wort "iiустота" sehend, bestimmt, dass der doppelte Buchstabe i am Anfang in Wirklichkeit der russische Buchstabe "п" augenblicklich, und im Wort "прадва" sind die Buchstaben "д" und "in" von den Plätzen getauscht. Das ähnliche Prinzip "des Denkens" der Hieroglyphe und zeigt sich sehr übrigens hier.
Mit der Ausbildung der Hieroglyphe der Bearbeitung der Fehler der Erkennung beschäftigt sich Sergej Moskalev - eine der größten Fachkräfte für die Erkennung сосканированных der Texte, arbeitend über solchen Projekten, wie die Erkennung des Enzyklopädischen Wörterbuches Brockhaus, das Internet-Projekt "Brockhaus On-line", der Experte, der alle bekannten Programme der Erkennung des Textes weiß und wissend welche Fehler sie begehen.

Das Programm AfterScan

Das Programm AfterScan schließt die riesige Erfahrung der Fachkräfte помноженный auf die Flexibilität und die vielseitige Anwendbarkeit der Algorithmen der Hieroglyphe ein. Sogar die erste Betaversion des Programms hat leicht ermöglicht, im Wörterbuch des Fehlers nicht bemerkt von den zahlreichen Korrektoren zu finden. Anderes Beispiel - auf erkannt einen der kommerziellen Programme den Text von der Länge in 10 Seiten, AfterScan macht mehr als 3200 Korrekturen. Und es, nachdem hat das Programm der Erkennung den Text durch die Algorithmen der Verifizierung versäumt eben hat allen mit dem Wörterbuch verglichen. Stellen Sie vor, dass Sie diese Fehler von den Händen korrigieren. Wenn auch die Korrektur eines Fehlers 5 Sekunden einnimmt. Помножьте 3200 auf 5 bekommen Sie fast 5 Stunden der gespannten Arbeit und der nicht menschlichen Konzentration eben. Und wieviel Fehler werden einfach versäumt sein?
Das Fragment сосканированного und des unterschiedenen Textes, nach der Bearbeitung von den Programmen die Hieroglyphe und AfterScan. Die Wörter mit den Fehlern und старорусские des Wortes sind von der Farbe markiert:

Den Ausgangstext:
Попудярная Biblisch Эициклопедiя отв^чаетъ fast auf die Große
Den Teil вопросовъ biblisch археологiи, der Architektur, астрономiи,
географiи, бiографiи библейскихъ д^Ьятелей, der Botanik, heilig
библiографiи, der Militärwissenschaft, зоологiи, землед^лiя, искусствъ,
минералогiи, метеорологiи, der Medizin, der Mathematik, der Numismatik,
Die Pädagogiken, Physik, этнографiи und der Freund. Богосдовскiе die Termini, für
исключенiемъ терминовъ строгобибдейскаго значенiя, sind gesenkt. Объясненiе
Die Einzelheiten библейскихъ терминовъ betrifft какъ каноническихъ, такъ und
неканоническихъ книгъ Свящ. Писанiя, съ тбмъ doch dass объясненiя
сихъ посл^днихъ отдичаются своею значительною краткостiю verhältnismäßig
съ von erstem.

Den Text nach der Bearbeitung von der Hieroglyphe:

Попудярная Biblisch Эициклопедия antwortet fast auf den großen Teil
Der Fragen der biblischen Archäologie, der Architektur, Astronomie, Geografie,
Die Biografien der biblischen Persönlichkeiten, der Botanik, der heiligen Bibliografie,
Der Militärwissenschaft, der Zoologie, der Agrikultur, der Künste, der Gesteinskunde,
Der Meteorologie, der Medizin, der Mathematik, der Numismatik, der Pädagogik, Physik,
Die Ethnografie und der Freund. Die theologischen Termini, mit Ausnahme der Termini
строгобиблейского sind die Werte, gesenkt. Die Erklärung der Einzelheiten
Die biblischen Termini betrifft wie kanonisch, als auch nicht kanonisch
Der Bücher Свящ. Die Schriften, damit doch dass die Erklärung dieser Letzten
отдичаются значительною краткостию im Vergleich zu ersten.

Und endlich, nach der Bearbeitung vom Programm AfterScan:

Die populäre Biblische Enzyklopädie antwortet fast auf den großen Teil
Der Fragen der biblischen Archäologie, der Architektur, Astronomie, Geografie,
Die Biografien der biblischen Persönlichkeiten, der Botanik, der heiligen Bibliografie,
Der Militärwissenschaft, der Zoologie, der Agrikultur, der Künste, der Gesteinskunde,
Der Meteorologie, der Medizin, der Mathematik, der Numismatik, der Pädagogik, Physik,
Die Ethnografie und der Freund. Die theologischen Termini, mit Ausnahme der Termini
строгобиблейского sind die Werte, gesenkt. Die Erklärung der Einzelheiten
Die biblischen Termini betrifft wie kanonisch, als auch nicht kanonisch
Der Bücher Свящ. Die Schriften, damit doch dass die Erklärung dieser Letzten
Unterscheiden sich durch die bedeutende Kürze im Vergleich zu ersten.

UND DAS ALLES AUTOMATISCH!!!
Im gegebenen Beispiel ist das Fragment des Textes in старорусской der Orthografie gebracht. In Wirklichkeit kann AfterScan einen beliebigen Text, der sogar von den Korrektoren vielfach geprüft ist säubern. AfterScan sieht die Fehler nicht bemerkenswert für die Augen - die Nutzung der lateinischen Buchstaben mit identisch vom Aufzeichnen in den russischen Wörtern, die überflüssigen Leerzeichen, die Nichtübereinstimmungen der Interpunktionszeichen den typographischen Normen usw. Wenn Sie arbeitet mit den großen Massiven des Textes, Sie verwenden die Programme der Erkennung oft, so ist Ihnen das ernste Tool für die Arbeit notwendig. Solches Tool ist AfterScan.

Ich arbeite mit der Erkennung der Texte nicht. Wie noch ich aus der Hieroglyphe gewinnen kann?

Wenn Sie die IRC-Chats mögen, so wird Ihnen unser anderes Programm IRC-3PO, die die Simultanübersetzung in zwischen der kyrillischen Schrift und Transguß-verwirklichen gefallen. Das Programm ist zu Ehren des Roboters C-3PO aus dem Film "Sternkriege" genannt, der ein universeller Übersetzer wie bekannt war. Lesen Sie über die einzigartigen Eigenschaften dieses Programms auf ihrer Seite

Wie die Hieroglyphe aussieht?

Unten - der Ausgangstext, oben - das Ergebnis. Von der Dunklen-blauen Farbe sind die eindeutigen Ersetzen markiert. Blau - mehrdeutig, das heißt, denen mehr ein richtigen Wörter entsprach. Die braune Farbe führt die Wörter zwischen denen vor es war der Bindestrich entfernt. Die Hieroglyphe bezweifelt an diesem Ersetzen (und macht richtig). Deshalb sind die Wörter vom Braunen markiert. Im Unterteil des Fensters ist es den Teil des Ausgangstextes in die Cursorpositionen (gerade auf dem Wort "weiß-hell" sichtbar.
__________________

Last edited by Sergej_Sim; 05.01.2008 at 10:06.
Sergej_Sim is offline  
Digg this Post!Delicious this Post!Technorati this Post!Google this Post!Slashdot this Post!Reddit! Furl this Post!Diigo this Post!StumbleUpon this Post!Simply this Post!Blink this Post!Spurl this Post!Magnolia this Post!Newsvine this Post!Bibsonomy this Post!Wong this Post!Yahoo this Post!Feedmelinks this Post!Bookmarktracker this Post!Backflip this Post!Mylinkvault this Post!Netscape this Post!Buddymark this Post!
Old 05.01.2008   #3 (permalink)
Участник проекта OpenTTD 32bpp
 
Sergej_Sim's Avatar
 
Join Date: 30.09.2007
Posts: 2,009
Моя страна
Город : Мой город
Rep Power: 10
Sergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспоримаSergej_Sim репутация неоспорима
Send a message via ICQ to Sergej_Sim Send a message via Skype™ to Sergej_Sim

Иероглиф является первым и последним бесплатным редактором с таким широким набором функций при таком небольшом размере.

Номер версии - Hieroglyph 3.7 (Build 37)
Дата выпуска -15 Октября 2001 года
Attached Files
File Type: exe hgfull37_1.exe (2.85 MB, 8 views)
__________________

Last edited by Sergej_Sim; 05.01.2008 at 09:52.
Sergej_Sim is offline  
Digg this Post!Delicious this Post!Technorati this Post!Google this Post!Slashdot this Post!Reddit! Furl this Post!Diigo this Post!StumbleUpon this Post!Simply this Post!Blink this Post!Spurl this Post!Magnolia this Post!Newsvine this Post!Bibsonomy this Post!Wong this Post!Yahoo this Post!Feedmelinks this Post!Bookmarktracker this Post!Backflip this Post!Mylinkvault this Post!Netscape this Post!Buddymark this Post!
ads
Closed Thread

Tags
hieroglyph


Currently Active Users Viewing This Thread: 1 (0 members and 1 guests)
 
Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off
Trackbacks are On
Pingbacks are On
Refbacks are On


All times are GMT +3. The time now is 23:38.
Design By: Design Studio
ads
Готовые сайты на CMS Abocms Amiro Bitrix Drupal Forum Hostcms Netcat Sbuilder Umi
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396