Историческая информатика - рубрика Новые методы и технологии обработки исторических источников
по

 

 

Историческая информатика
12+
Меню журнала
> Архив номеров > Рубрики > О журнале > Авторы > О журнале > Требования к статьям > Порядок рецензирования статей > Ретракция статей > Этические принципы > Политика открытого доступа > Оплата за публикации в открытом доступе > Публикация за 72 часа: что это? > Политика авторских прав и лицензий > Политика цифрового хранения публикации > Политика идентификации статей > Политика проверки на плагиат > Редакция > Редакционный совет
Журналы индексируются
Реквизиты журнала

ГЛАВНАЯ > Журнал "Историческая информатика" > Рубрика "Новые методы и технологии обработки исторических источников"
Новые методы и технологии обработки исторических источников
Ринчинов О.С. - Диахронический корпус бурятского языка как цифровой инструмент исторических исследований: подходы, решения, экспериментальные исследования c. 26-34

DOI:
10.7256/2585-7797.2020.2.33446

Аннотация: В статье рассмотрены вопросы использования диахронического корпуса бурятского языка, составленного на основе написанных на старомонгольской письменности летописей, для реконструкции истории и исторической географии бурятского народа. В этой связи обсуждены основные проблемы семантической разметки корпусных данных, размер которого в настоящее время достигает 82 тыс. словоупотреблений. Новизна исследования заключается в том, что впервые объектом применения методов компьютерной лингвистики являются тексты на классическом монгольском языке, представленные в латинизированной транслитерации. Описаны подходы к разработке онтологической схемы историко-культурной предметной области, выявлению элементов родо-племенного и географического контекстов. На основе вычислительного эксперимента, проведенного с использованием СУБД MS Access и языка SQL, показаны преимущества использования методологии авторитетного контроля, в частности, объектов категорий «род/семья» и «место», для первичного анализа корпусных данных и формирования основных семантических кластеров. Применение авторитетных записей позволило в существенной степени ускорить накопление эмпирических данных для автоматизации содержательного анализа текстов, включенных в корпус. Проведенные эксперименты позволили определить направления дальнейшей работы по созданию и совершенствованию инструментов семантической разметки диахронического корпуса бурятского языка и превращению его в удобный инструмент исторических исследований.
Торвальдсен Г. - Автоматизация транскрибирования исторических источников: опыт работы с материалами переписи населения Норвегии 1950 года c. 94-103

DOI:
10.7256/2585-7797.2018.1.25686

Аннотация: Данная статья посвящена проблемам транскрибирования рукописных материалов переписи населения Норвегии 1950 г. Они представляют собой 801 000 двусторонних опросных листов, каждый из которых был отсканирован. Программы оптического распознавания печатного текста совершенствуются на протяжении более чем четырех десятилетий. В настоящее время исследователи стремятся применить аналогичные методы для транскрибирования рукописного материала. В статье проанаизирован опыт работы Центра исторической документации Норвегии Университета Тромсо по распознаванию рукописного текста, рассматриваются проблемы использования различных методов распознавания текста и возможности их применения к номинативным источникам. Из-за трудностей с распознаванием и выделением самостоятельных рукописных символов, изображения целых слов математически группируются по соответствию подобным изображениям или же идет поиск этих слов-изображений в ранее транскрибированных источниках. После контроля качества распознавания программное обеспечение использует номера строк для размещения информации из транскрибируемых ячеек, после чего они становятся частью базы данных переписи. Кроме того, разрабатывается специальное программное обеспечение для обработки рукописных числовых кодов, данных о профессиях, образовании и т. д. Предложенные в статье методы дают возможность подняться на новый уровень и качество транскрибирования рукописного текста и могут быть применены для распознавания записей номинативных источников РОссии, в частности метрических книг и записей ЗАГС. Основными задачами по-прежнему остаются поиск методов и алгоритмов, которые оптимально подбирают связи между различными переменными и рационализация методов интерактивной корректуры.
Акашева А.А., Чечин А.В. - Методика реконструкции межевого плана и границ Нижнего Новгорода 1784 года на базе специализированных геодезических программ c. 111-142

DOI:
10.7256/2585-7797.2020.1.32103

Аннотация: Одной из задач исторических ГИС является геопривязка к современной системе координат старинных карт, которые по определению содержат погрешности разного рода. В связи с этим есть потребность в разработке алгоритмов, позволяющих избежать их и позиционировать источники с наименьшими деформациями, искажениям. Описанная задача актуальна и для русских планов Генерального межевания. Их особенность заключается в том, что они содержат точные геодезические характеристики земельных дач. Предметом исследования является комплекс архивных планов Нижнего Новгорода конца XVIII в., на основе которых была разработана методика реконструкции границ города и межевых планов. Методология исследования базируется на принципах историзма, системности и объективности, выделяется роль математико-статистических методов, использованы специально-исторические (историко-типологический, историко-генетический) методы и геодезический метод обработки и уравнивания теодолитного хода, моделирования, картометрический. Научная новизна определяется алгоритмом реконструкции границ города и межевых исторических планов, технологическими решениями для изучения объекта с помощью геодезических программ, новыми данными о землеустроительных работах и созданных по их результатам картографическим материалам в конкретном регионе России. Основными выводами исследования являются позиционированные границы Нижнего Новгорода в условной системе координат. Установлено, что теодолитные ходы изученных дач имели существенные угловые и относительные линейные погрешности: для селитебной дачи они составили 3°29' и 1/31, для выгонной – 2°49' и 1/80 соответственно, для Благовещенского монастыря оказались допустимыми: 0°37’и 1/139. Получен растровый межевой план Нижнего Новгорода. В дальнейшем он может быть использован для геопривязки и создания исторической ГИС.
Ляховицкий Е.А., Цыпкин Д.О. - Инфракрасная визуализация текста в изучении памятников древнерусской письменности c. 148-156

DOI:
10.7256/2585-7797.2019.4.31588

Аннотация: Предметом исследования является текст рукописного памятника, рассматриваемый, как материальный объект - система следов пишущего инструмента на писчем материале (бумаге, пергамене). Трассы орудия письма представляют собой сочетание рельефа и красителя (например, чернил). Текст, понимаемый, как совокупность таких трасс характеризуется наличием перепадов в толщине слоя красителя и его химическом составе на различных уровнях структуры текста. Такие перепады обусловлены различными аспектами письменного навыка и могут использоваться для его характеристики. Задача настоящей публикации — представить возможности современного оптико-электронного спектрозонального исследования исторических чернил в изучении текста рукописно-книжных памятников. Речь пойдет о технологии цифровой визуализации документов в ближней инфракрасной области спектра с последующей программной обработкой изображений Основным результатом настоящего исследования является формулирование основных направлений в раскрытии информационного потенциала текста, как физического объекта - системы следов посредством спектрозональной визуализации. Такими направлениями являются: 1) изучение следов пишущего инструмента с целью реконструкции системы движений и техники письма; 2) определение областей разновременной работы писца в рукописи ; 3) обнаружение правки в документе.
Кузнецов А.В. - Компьютерный анализ текстов на латинском языке: Латентно-семантический анализ «Истории готов, вандалов и свевов» Исидора Севильского c. 202-217

DOI:
10.7256/2585-7797.2020.2.32961

Аннотация: В статье предпринимается попытка с использованием современных методов интеллектуального анализа текстов исследовать латиноязычный текст хроники «История готов, вандалов и свевов» выдающегося богослова и ученого VII века Исидора Севильского. Ставится цель проверить выдвинутую в историографии гипотезу о наличии у автора представлений об определенной иерархии варварских народов. Основное внимание направлено на раскрытие неявных семантических взаимоотношений между различными частями произведения с целью уточнения отношения автора к трем варварским народам. Анализ текста проводился на языке программирования R. В качестве конкретного метода бы выбран метод латентно-семантического анализа, позволяющий проводить сравнение и кластеризацию текстов на основе семантического пространства, построенного путем сингулярного разложения терм-документной матрицы. Новизна исследования заключается в том, что впервые реализован полный цикл латентно-семантического анализа средневекового латиноязычного текста. Проведена предварительная подготовка, построено семантическое пространство текста памятника, осуществлено сравнение семантической схожести текстов на основе меры косинусного сходства. Результаты анализа позволяют утверждать, что Исидор Севильский действительно выстраивает иерархию из трех варварских народов, придавая большее сходство описанию вестготов и свевов и особняком ставя вандалов.
Торвальдсен Г. - Связывание записей в историческом регистре населения Норвегии c. 212-231

DOI:
10.7256/2585-7797.2019.2.30126

Аннотация: Исторический регистр населения Норвегии содержит данные о населении страны с 1800 до 1964 г. Сведения о населении страны с 1964 г. до современности собраны в Центральном регистре населения. Исторический регистр состоит из данных метрических книг и записей актов гражданского состояния, заполняющих пробелы между переписями населения, проводившимися каждые десть лет. В 1801 г. и, начиная с 1865 г., эти переписи являлись номинативными, то есть содержали имена людей. Настоящая статья посвящена проблемам связывания записей переписей и метрических книг (record linkage) в период с 1800 по 1920 г. Особое внимание уделяется идентификации индивидов и трудностям связывания записей. Главная проблема заключается в том, чтобы идентифицировать человека по записям, относящимся к разным годам, в условиях значительного количества однофамильцев и вариации фиксации их имен, а также возраста. Создание стабильных идентификаторов индивидов и процедура связывания записей из различных источников потребовали разработки нового программного обеспечения, объединяющего автоматические и ручные методы. С помощью рассмотренных методов удалось связать сведения о более чем миллионе человек из нескольких источников.Анализ локальных баз данных позволяет надеяться на успешное связывание от 2/3 до 90% записей по различным периодам и регионам страны. Исторический регистр Норвегии является уникальным по охвату территории и многообразию связанных в нем исторических источников.
Фролов А.А. - Опыт применения инструментов геоинформатики в кодикологическом исследовании писцовых книг c. 218-233

DOI:
10.7256/2585-7797.2020.2.33330

Аннотация: Предметом изучения в статье являются способы обобщения и визуализации кодикологических наблюдений над архивной рукописью средствами геоинформатики. Данное решение позволяет систематизовать сведения исторического источника и делает их максимально доступными для широкого круга пользователей сети Интернет. Созданный в результате веб-проект может использоваться не только в исследовательских, но и в образовательных целях. Материалом для данной работы послужили результаты кодикологического изучения новгородской писцовой книги Водской пятины письма С. Клушина, работа над которой была завершена в 1542 г. (хранится в РГАДА). В рамках предлагаемого подхода материальный носитель исторического текста, рукопись, рассматривается как особое пространство в собственной системе координат. Это делает применимыми для установления топологии (то есть взаимного соотношения) ее объектов методы геоинформатики. Предлагаемый подход реализуется на практике впервые, поэтому основное внимание уделено описанию важнейших этапов обработки исходных кодикологических материалов для превращения их в ГИС-проект, основанный на реляционной базе данных. Результатом проделанной работы стал веб-ресурс, позволяющий визуализировать значительный объем данных о рукописи. Его, однако, не следует считать картой или картоидом. Более корректным представляется обозначить его как кодикологическую схему рукописи, созданную в среде ГИС и опубликованную как веб-ресурс, но без карты как таковой. Полученная схема корректируется и управляется средствами, которые используются при работе с базами данных и не ограничены картографическим интерфейсом.
Брюханова Е.А., Еремин А.А. - Оценка репрезентативности первичных материалов переписи 1897 г.: картографический подход c. 232-241

DOI:
10.7256/2585-7797.2019.2.29770

Аннотация: Основное внимание авторы уделяют оценке репрезентативности и степени сохранности переписных листов Первой всеобщей переписи населения 1897 г., отложившихся в российских и зарубежных архивах. Изучение сохранившихся коллекций первичных документов переписи позволяет сделать вывод о неоднородности термина «переписные листы», который включает несколько разных форм, применявшихся в зависимости от вида домохозяйства и региона, а также первые, вторые и третьи экземпляры переписных листов. Особенностью статьи является то, что полученные выводы были представлены в виде картограмм на основе современных и исторических карт. Исследование проводилось с помощью источниковедческого и пространственного анализа, а также комплексного подхода, в рамках которого переписные листы рассматривались как единый исторический источник вне зависимости от места их хранения. Новизна исследования заключатся в выявлении и введении в научный оборот комплекса первичных материалов Первой всеобщей переписи населения 1897 г. Кроме того, был предложен оригинальный подход, учитывающего как количество населенных мест, так и число сохранившихся переписных листов по ним, позволивший провести оценку степени сохранности переписного материала по уездам Российской империи. Делается вывод о том, что переписные листы с разной степенью сохранности были выявлены для 47% губерний и 25,5% уездов Российской империи. Коллекции переписных листов охватывают регионы Европейской России и Сибири, частично Кавказа и Средней Азии. Объем данных сохранившихся переписных листов и их «территориальный разброс» позволяет рассматривать их как комплексный источник по истории населения Российской империи рубежа XIX-XX вв.
Другие сайты издательства:
Официальный сайт издательства NotaBene / Aurora Group s.r.o.
Сайт исторического журнала "History Illustrated"