litbook

Проза


Рукописи членов еврейской зондеркоманды в Аушвице-Биркенау: приращение прочитанного методами мультиспектральной съемки0

Члены «зондеркоммандо» и их рукописи

 Члены «зондеркоммандо» в лагере смерти Аушвиц-Биркенау – это вспомогательные рабочие бригад, составленных почти исключительно из евреев, которых нацисты понуждали ассистировать себе в массовом конвейерном убийстве сотен тысяч других людей, — как евреев, так и неевреев: ассистировать в газовых камерах, в кремации их трупов, в утилизации их пепла, золотых зубов и женских волос. То, что эти люди 7 октября 1944 года поднимут восстание и уничтожат один из крематориев, и то, что некоторые из них, вопреки всему, уцелеют и переживут Шоа, нацисты не могли себе представить и в страшном сне. Тем не менее, около 110 человек из примерно 2200 уцелели, а несколько десятков из них или написали о пережитом или дали подробные интервью.

Но и многие погибшие оставили после себя письменные свидетельства, часть из них была обнаружена после окончания войны в земле и пепле близ крематориев Аушвица-Освенцима. Эти «свитки из пепла» — бесспорно, центральные документы Холокоста, до недавнего времени совершенно неизвестные в России, — впервые на русском языке и впервые в полном, нецензурованном виде, вышли в ростовском издательстве «Феникс» в 2013 году (в 2015 году они переизданы и в издательстве «Аст»).

На первый взгляд, этот корпус «свитков из пепла» имеет вид подытоживающей сводки. Но это иллюзия. Это всего лишь промежуточная версия. Проблема в том, что сохранность оригиналов – очень низкая. Так, прочитываемость рукописи Залмана Градовского, хранящейся в Военно-медицинском музее в Санкт-Петербурге, — не более 60%, а остальных, хранящихся в Освенциме и Варшаве – гораздо ниже.

В то же время современные технологии и технические средства позволяют надеяться на ощутимое приращение прочитанного. Их грамотное и осторожное приложение к рукописям зондеркоммандовцев позволило бы впервые прочитать те места, что до сих пор не поддавались расшифровке. Или, по крайней мере, существенную их часть.

Прочтение непрочитанного в рукописях членов зондеркомандо в Аушвице-Биркенау представляет колоссальный историко-культурный интерес. Рано или поздно преграды на этом пути будут преодолены, но чем больше времени будет упущено, тем слабее будет эффект от применения технологий.

Подавляющее большинство оригиналов рукописей Залмана Градовского, в частности, его записной книжки и так называемого «Письма потомкам», находится в России, в архиве Военно-Медицинского музея в Санкт-Петербурге (несколько оригиналов другой его рукописи находятся в Иерусалиме в частном собрании). В связи с подготовкой и изданием русского перевода текстов Градовского, как и других «зондеркоммандовцев», мы располагали собранием их скан-изображений, сделанных в середине 2000-х гг. с применением техники, сегодня уже морально устаревшей.

Эти рукописи нужно подвергнуть повторному сканированию, а в идеале описанному ниже мультиспектральному анализу, а впервые открывшиеся при этом фрагменты текста прочесть и перевести на русский язык, вводя их тем самым в исторический научный оборот.

Именно в этом суть проекта, который следовало бы осуществить.

Его первая фаза подразумевала бы работу с тем первичным скан-материалом, что уже имеется в нашем распоряжении. Вторая – опиралась бы на применение еще более совершенных методик и на базе совершенно нового, с применением самых современных средств, фотографирования или сканирования оригиналов. Ее целесообразно осуществить после исчерпания возможностей и завершения первой фазы и анализа ее результатов.

 

Методы мультиспектральной и гиперспектральной съемки: возможности и достижения

Спектроскопия - это метод получения спектрограмм некоего вещества под воздействием разного вида излучений. Основная задача спектроскопии: исходя из спектрограммы объекта – узнать о нем как можно больше, в случае изучения текста нечитаемой рукописи – «увидеть» на ней как можно больше и «прочесть» все это как можно лучше.

Материалы, применявшиеся для нанесения рукописных текстов и для их написания, были весьма различными: папирус и толченая ржавчина или угль, целлюлоза и графит. Химический состав носителя информации и самой информации (букв) очень различен, но в любом случае, выбирался из физиологической способности человека к прочтению рукописи в видимом свете.

Но время и окружающая среда делают свое дело, и информация часто выходит за рамки возможности нашего восприятия. В невидимом глазу диапазоне вещества продолжают себя проявлять: мы можем обнаружить как появление одних новых деталей, так и исчезновение других.

Полученный на этой основе метод получил название «мультиспектральной съемки» (МСС): он позволяет гораздо точнее отделять полезный сигнал от шума. Он основан на фотографировании рукописи на специализированную фотокамеру с применением света разных длин волн из так называемого «оптического диапазона» - от ультрафиолетового (УФ) до инфракрасного (ИК).

В результате мы получаем несколько цифровых фотографий одного объекта. Последующая контрастная обработка цифровых данных позволяет обособлять буквы и заново выделять и распознавать письменный текст.

Таким образом часто удается прочитать выцветшие, поблекшие или же, как в нашем случае, сильно размытые чернила или химический карандаш. Прочитанное можно записать и перевести, а переведя — попытаться осмыслить отвоеванную у небытия информацию.

Оптический диапазон, используемый в МСС, - это расширенный диапазон видимого нами света (рис.1).

Для более точного анализа можно снять гиперспектральное изображение. В этом случае спектральный датчик фиксирует объект в оптическом диапазоне с более частым шагом. В результате мы имеем трехмерную модель изображения. Получается условный гиперкуб, одна из осей координат которого записывается в виде длины волны, а остальные две относятся к сфотографированной площади. Это позволяет – в поисках образа символа, пропавшего с бумаги, – пройтись по всему спектру изображения практически с шагом длины волны в 1 нанометр (нм).

В некоторых случаях имеет смысл сканирования рукописи в слабом рентгеновском излучении. В состав чернил, как правило, входит железо, которое хорошо реагирует на рентгеновские лучи и начинает светиться на фоне пергамента.

Этот последний метод доступен только в научных лабораториях. Его сложность проявляется и в его скорости: на специальное рентген-сканирование страницы 14x17 см в разрешении 600dpi  уходит минимум около 36 часов#1.

Все эти методы не являются деструктивными или инвазивными для рукописи.

 

Примеры эффективного использования мультиспектральной съемки

Вот несколько примеров успешного применения МСС для прочтения непрочитанного в знаменитых рукописных документах.

Осенью 2014 года на камеру E7 «Mega vision» высокого разрешения была произведена мультиспектральная съемка 800-летней (sic!) рукописи «Magna Carta» («Великой хартии вольностей»), хранящейся в Британской библиотеке (см. рис. 2)#2 . Результат дешифровки рукописи, в свое время пострадавшей и от огня, будет доступен посетителям специальной выставки «Magna Carta» в Британской библиотеке#3 .

Аналогичный хороший результат получен и с автографом фрагмента дневника знаменитого британского путешественника Дэвида Ливингстона (рис.3)#4. Оказавшись в конце жизни в области Нуанге на р. Конго, Ливингстон в отсутствие писчей бумаги был вынужден вести свои дневники на газете и использовать вместо чернил сок из семян местной ягоды. Тексты дневника датированы 15 июля 1871 года и содержат свидетельства резни местного африканского населения арабскими работорговцами из Занзибара: около 400 или 500 африканцев, большинство из них женщины, погибли в течение одного дня.

До привлечения методов МСС эта рукопись Ливингстона считалась не читаемой. Сейчас же она полностью дешифрирована и находится в свободном доступе в интернете.

Обобщая, можно сказать, что метод МСС для решения задач дешифровки трудночитаемых старых рукописей стал преобладающим.

Для анализа рукописи иногда применяется и рентгеновское оборудование. Так, «Палимпсест Архимеда»#5, содержавший тексты Архимеда, записанные в X веке в Византии, был обнаружен в начале XX века и сейчас интенсивно исследуется. После 1938 года один из собственников рукописи, дополнив рукопись четырьмя миниатюрами в византийском стиле, сделал расположенный под ними текст нечитаемым.  Но в 2005 году многие утраченные детали проступили после безопасного для рукописи сканирования под воздействием рентгеновских лучей#6.

В апреле 2007 года было объявлено об обнаружении в Художественном музее Уолтерса ранее неизвестного комментария к произведению Аристотеля, предположительно приписываемого Александру Афродисийскому. Большая часть этого текста также была прочитана с использованием рентгеновских лучей в 2009 году.

 Еще более сложную задачу поставили перед собой итальянские исследователи. А именно: попытаться прочитать рукописи, обнаруженные при раскопках погребенного под лавой и пеплом Геркуланума, которые не только обуглены, но еще и изначально свернуты в трубочку! Все предыдущие попытки успехом не увенчались — при попытке развертывания они просто рассыпались.

Рентгеновская томография не способна выделить значимый контраст букв среди столь схожих материалов в обугленной рукописи. Тогда Вито Моцелла (Vito Mocella) из итальянского Института микроэлектроники и микросистем предложил искать не контраст между материалами, а различие в высотах между папирусом и чернилами. Даже после пожара и в состоянии свернутости папируса чернила остаются на высоте около 100 мкм над поверхностью; к счастью, они не проникают вглубь папируса. Если ориентироваться на фазовое смещение волны при прохождении рентгеновских лучей через материал, то можно получить искомый контраст из-за разницы в толщине.

Выбранный метод называется «рентгеновская томография с фазовым контрастом». Он позволяет сделать полную 3Dмодель объекта с его внутренним содержимым, а уже после этого можно попытаться «вытащить» кусок папируса и «развернуть» его на плоскости. Первые же попытки такого чтения показали обнадеживающую различимость букв#7 .

  

Непрочитанные рукописи членов зондеркоммандо

Что касается цифровых копий рукописей членов зондеркоммандо, хранящихся в музеях Освенцима и Санкт-Петербурга, то все выполнены с помощью не профессиональной, а бытовой фото- или скантехники. Для получения цветного изображения бытовой планшетный сканер производит оцифровку изображения в трех цветовых фильтрах – красном, зеленом и синем: они лишь незначительно выходят за рамки видимого диапазона, прихватывая лишь совсем чуть-чуть от ультрафиолетового и инфракрасного диапазонов.

Полученный в результате сканирования файл состоит из трех полутоновых изображений, на основе которых компьютер и воспроизводит цвет на экране монитора. Варьируя тремя каналами изображения в графическом редакторе (например, вPhotoshop‘е) – повышая контраст элементов, до этого и без этого почти не просматривающихся на фоне «шумов», мы можем выделять полезный сигнал. Такой алгоритм можно назвать методом контраста каналов изображения. Он достаточно универсален и используется как в программном обеспечении профессиональных научных систем, так и в общедоступных графических редакторах. Но этот способ только аналитический, и он напрямую зависит от используемого оборудования для съемки.

Но и с тем, что есть (точнее, с тем, чем пользовались музеи-хранители), удалось достигнуть довольно неплохих результатов (в случае, например, рукописи Марселя Наджари). Она, по-видимому, была оцифрована на планшетном сканере в разрешении, предположительно, в 300dpi#8. Второе преимущество скана этой рукописи – сочетание желтой бумаги и синих чернил. Почти не читаемые в видимом свете, поскольку чернила сильно выцвели, они смогли дать приемлемый контраст с бумагой в красном канале изображения.

На рис. 4 представлена своего рода «триада» скан-образов одних и тех же листов рукописи Наджари: справа – исходное изображение, полученное в Освенцимском музее, в центре – рукопись после обработки в графическом редакторе, а слева – то же, но с обведением обнаружившихся с хорошей читаемостью букв. Представляется, что левое изображение наиболее перспективно для дальнейшей работы переводчика.

С записной книжкой Градовского ситуация несколько иная (рис.6). И без того низкая разборчивость размытых деталей усугублена артефактами («шумом») сканера. Хотя физические размеры скана рукописи Градовского (2352 x 1778) близки к аналогичным у Наджари (1656 x 2416), но визуально они худшего качества (Рис.5).

Смытые чернила плохо контрастируют с бумагой. Поэтому смытая часть текста осталась без синего красителя и игры с контрастом каналов проходят с объективно меньшим результатом, чем в случае Наджари#9. Повышение контраста требуемых зон цветного изображения рукописи при хорошем разрешении сканирования может дать, по словам эксперта, от 30% и выше эффективно прочитанных новых символов.

Рукопись Левенталя (рис. 8, 2322 x 1853) сейчас находится в обработке. 
Ее состояние хуже, чем у рукописи Наджари, но прирост читаемого все же заметен.

 

Исследовательский алгоритм

Итак, алгоритм действий довольно прост.

Шаг первый. Восстановление цветового баланса цифрового файла рукописи (эквализация каналов), так как сканеры визуально стараются подгонять баланс под визуальное соответствие цветов оригинала сканируемого документа.

Шаг второй. Корректировка уровней для задания новой экспозиции изображению, при котором информация не теряется, но при этом монитор  воспроизводит оператору изображение в максимальном динамическом диапазоне.

Шаг третий. Поканальный визуальный анализ изображения на наличие лучшего контраста информации и шума (как правило, это красный канал). При невозможности использования для выделения деталей фильтра black&white(Photoshop CC), остается менять только экспозицию и контраст изображения. В случае с Градовским перевод в полутона произведен не был, так как отсутствует контраст букв и бумаги. Здесь применен фильтр HighPass для усреднения перепадов экспозиции из-за неровной поверхности сканирования и перепадов контраста текста.

В результате применения этого алгоритма весь текст или его часть, хотя и остается слабоконтрастным, но становится более различимым.

Существенна и внутренняя дифференциация рукописи: один фрагмент текста может лучше читаться при одних параметрах, а другой – при других. Поэтому техническому оператору этого алгоритма целесообразно обводить каждую обозначившуюся или прояснившуюся букву самостоятельно (с условием знакомства с графической системой языка рукописи).

В любом случае переводчик получает изображение с повышенным уровнем читаемости для всех символов.

 

Оборудование

Для дорасшифровок «Свитков из пепла» необходимо оборудование для мультиспектральной съемки. Это источники ультрафиолетового и инфракрасного света и так называемая «научная камера», восприимчивая к оптическому диапазону. Сегодня лидером в мировом сканировании трудночитаемых рукописей является американская компания «Mega vision». Именно ее система «EV» использовалась Британской библиотекой для сканирования 800-летней рукописи. Этот комплекс имеет полностью законченное решение для сканирования: необходимые светодиодные прожекторы, 50 мегапиксельная монохромная камера E7 (огромное преимущество в передаче деталей по сравнению с любыми топовыми цветными зеркалками) и программное обеспечение. Стоимость комплекса в отрытых местах не указана, но одна только камера подобного уровня стоит около 10 000 $#10  по анализу схожих товаров на рынке.

Но даже без использования столь радикальных технических усовершенствований использование описанного алгоритма обработки цифровых копий рукописей дает определенные результаты и само по себе. Обработка имевшихся в нашем распоряжении пробных бытовых сканов рукописей Залмана Градовского и Марселя Наджари показала наглядное приращение их читаемости. В случае Наджари подтвержденное и пробным переводом с оригинала: если из 13 листов исходных сканов 12 были нечитаемыми на 100%, то использование алгоритма обработки обозначило читаемые фрагменты на всех листах, а выполненный пробный перевод показал его соизмеримость с первым переводом на польский и другие языки. Более того, удалось разобрать два женских имени, не прочитанных даже самым первым переводчиком!

Если привлечение дорогостоящего оборудования «Megavision» невозможно, то ощутимо существенное приращение читаемости может дать и элементарное пересканирование на другом – гораздо менее затратном – современном оборудовании#11. К примеру, сканер «Epson Perfection V850» стоимостью 950$ имеет максимальное оптическое разрешение 6400 точек на дюйм#12  (вместо текущих 300dpi!) и, в сочетании с рекомендуемым алгоритмом, может дать весьма значительный дешифрирующий эффект.

Весьма совершенным техническим решением для прочтения старых рукописей могут оказаться видеоспектральные компараторы, к примеру «VSC6000/HS»#13. Это профессиональное криминалистическое оборудование для проверки документов на профессиональном уровне. В его основе лежит сочетание технологии спектроскопии с микроскопией с возможностью получать гиперспектральное изображение. Съемка объекта производится в диапазоне в 400-1000 нм с шагом от 1-4 до 20 нм, что позволяет в реальном времени просмотреть срезы для выявления максимальной спектральной разницы чернил.

Но при этом и цифровые фотоаппараты, благодаря своей большей ценовой доступности, не теряют своей привлекательности. Из камеры аккуратно удаляется фильтр низких частот, который был призван пропускать свет только видимого диапазона. В связи с этим камера становится восприимчива к ближнему инфракрасному диапазону и ультрафиолету. Камера Nikon D800 без фильтра низких частот восприимчива к диапазону от 360 до 1100 нм. В то же время объектив Nikon Nikkor 50 mm f/1.8D пропускает свет в диапазоне 350 до 1700нм. В качестве источника освещения выступают галогеновые лампы (для ИК-диапазона), а поиск фильтров на требуемую длину волны для цифровых камер на рынке не представляет особой сложности#14.

Примечания

[1] По информации о работе с рукописью «Палимпсест Архимеда». См.: >>>

[2] См.: >>>

[3] Пройдет с 13 марта по 1 сентября 2015 г.

[4] См.: >>>

[5] См.: >>>

[6] См.: >>>

[7] См.: >>>

[8] Расчет велся исходя из размера страниц оригинала: 20x14 см и при 300 точек на дюйм получаем 2362x1654 точек , что почти полностью совпадает с размером цифровых копий рукописей из музея).

[9] Образец рукописи Лангфуса являет собой что-то среднее между Наджари и Градовским. По-видимому, он пользовался таким же химическим карандашом.

[10] См.: >>>

[11] Разрешение 300 точек на дюйм используется секретаршами для сканирования платежек для отправки по электронной почте, но никак не для анализа изображений!

[12] См.: >>>

[13] См.: >>>

 

Напечатано: в журнале "Записки по еврейской истории" № 7(185) июль 2015

Адрес оригинальной публикции: http://www.berkovich-zametki.com/2015/Zametki/Nomer7/Poljan1.php

 

 

Рейтинг:

0
Отдав голос за данное произведение, Вы оказываете влияние на его общий рейтинг, а также на рейтинг автора и журнала опубликовавшего этот текст.
Только зарегистрированные пользователи могут голосовать
Зарегистрируйтесь или войдите
для того чтобы оставлять комментарии
Лучшее в разделе:
Регистрация для авторов
В сообществе уже 995 авторов
Войти
Регистрация
О проекте
Правила
Все авторские права на произведения
сохранены за авторами и издателями.
По вопросам: support@litbook.ru
Разработка: goldapp.ru