Мишель Гуссенс и Себастиан Ратц (при участии Эйтана Гурари, Роберта Сьюса и Росса Мура). Путеводитель по пакету LaTeX и его Web-приложениям

Опубликовано в журнале "Компьютерра" №1 от 17.01.2002 г.

Эта книга - наверное, самый дорогой подарок из числа полученных мною на прошедшие праздники. В смысле, дороже всего обошедшийся, поскольку пришлось прочитать шесть сотен страниц, на что я совершенно не закладывался в своих праздничных планах.

Мишель Гуссенс и Себастиан Ратц (при участии Эйтана Гурари, Роберта Сьюса и Росса Мура). Путеводитель по пакету LaTeX и его Web-приложениям. Пер. с англ. - М.: «Мир», 2001. - 604 с., ил., компакт-диск.

Мишель Гуссенс и Себастиан Ратц (при участии Эйтана Гурари, Роберта Сьюса и Росса Мура). Путеводитель по пакету LaTeX и его Web-приложениям. Пер. с англ. - М.: «Мир», 2001. - 604 с., ил., компакт-диск.

Но не прочитать было нельзя, коль скоро в руки попал перевод (оригинала я не видел) этакой «книги двойного назначения».

Почему двойного?

Ну, во-первых, читатель, «купившийся» на название, обманут в своих ожиданиях не будет: книга представляет собой действительно обстоятельное руководство по Web-приложениям TeX. Если вы используете TeX и/или накопили архив сверстанных в нем материалов и теперь думаете, как все это сделать доступным средствами Web, покупайте без сомнений. Даже если общие черты решения вам известны. В книге подробнейшим образом описан существующий инструментарий (программы LaTeX2HTML - гл. 3 и TeX2ht - гл. 4), а в качестве бесплатного приложения - еще и инструментарий преобразования (La)TeX в PDF (пакет hyperref и программа pdfTeX - гл. 2), в том числе и без всякой «акробатики». Если вам, в отличие от меня, интересны средства непосредственного отображения LaTeX - для вас глава 5, описывающая techexplorer от IBM и WebEQ от Geometry Technologies.

Все это (плюс подробности, приведенные в приложениях) занимает около половины объема книги, и я хочу со всей определенностью заявить: исключительная компетентность авторов в предмете 1, замечательный стиль изложения и очень добросовестный перевод и его редактирование делают книгу тем, что называется must have 2 для всех TeXнарей.

Но, в конце концов, TeXническая тусовка - это «узкий круг ограниченных лиц»: математиков и прочих естественных ученых, лингвистов, изучающих разные непонятные языки с нечеловеческими системами письменности, и издательских работников, которым (не) посчастливилось специализироваться в этих областях.

«Вторым своим боком» книга обращена к гораздо большей аудитории (значительной ее части слово TeX вообще мало что говорит или не говорит ничего), и вот ее-то, как мне кажется, название может дезориентировать.

Дело в том, и это жирное во-вторых, что Гуссенс с Ратцем беззастенчиво пользуются доверчивостью читателей для того, чтобы под видом решения частных TeXнических вопросов обратиться к гораздо более глубоким проблемам ИТ-сферы в ее культурных и экономических аспектах.

В начале работы над книгой The LaTeX Graphics Companion 3, - пишут авторы, они собирались включить в нее вопросы, связанные с PDF, SGML и Web. Однако стало ясно, что для того, чтобы осветить материал, посвященный гипертексту и языку SGML, потребуется написать отдельную книгу.

Подозреваю, что это постфактум придуманная легенда, так как, вроде бы, SGML к графике отношение имеет опосредованное.

По сути дела, под обложкой TeXнического руководства и в обрамлении упомянутых TeXнических глав запрятано серьезное исследование оборота текстового (и не только) материала и технологий, его поддерживающих, в сложившейся глобальной среде коммуникации на основе сетей Интернет.

Если бы меня попросили выбрать ключевые для этой книги понятия, я бы назвал single sourcing, и повторил бы три раза, хотя в тексте этот термин, кажется, не встречается.

Сингл-сорсинг недавно был вскользь помянут в одной из статей темы номера «Милостивый государь…» (#420 от 13.11.01) как «возможность одновременного создания руководства и справочной системы» программы, обсуждаемая-де «в последние годы на Западе» (с. 25). Я понимаю, что в отдаленных провинциях ИТ-мира (например, в России, или среди адептов «решений Microsoft») многие основополагающие принципы, когда о них узнают, кажутся модной новинкой, имеющей ограниченное значение. Однако я не думаю, что читатели «Терры» заслуживают быть поощрены и укреплены в таком провинционализме, как бы того кому-то ни хотелось.

В действительности сингл-сорсинг (от английского single source - единый источник или единый исходник; устоявшегося перевода нет) - это принцип, имеющий силу глобального экономического и культурного императива, которому по меньшей мере четыре десятилетия и который не то что активно «обсуждается», а прямо-таки нависает над сферой ИТ и всеми сферами, в которые ИТ осуществляют свою экспансию.

Согласно этому принципу (я даю свою формулировку, не претендующую на изящество, исчерпывающий характер или окончательность):

  • собственной формой всякого контента, вовлекаемого в оборот (то есть выдерживающего более одного издания, комментируемого, исправляемого и/или дополняемого), является «прозрачный» формат, по возможности отделяющий логическую структуру от оформления;
  • в случаях, когда желательно преобразовать контент в «непрозрачный» формат, такое преобразование должно осуществляться с минимумом человеческого вмешательства (в идеале - автоматически);
  • «прозрачный» формат должен быть исчерпывающе специфицирован и стандартизован с максимально возможной степенью общности.

Учитывая, что «прозрачными» (transparent) принято называть форматы, допускающие и поддерживающие редактирование контента, а «непрозрачными» (opaque) - предназначенные лишь для копирования и распространения («жесткие» копии на бумаге, языки разметки страниц, такие как PostScript или PDF и пр.), формулировка почти тавтологическая.

О культурном значении этого принципа можно написать очень много 4, а его экономическое значение ощущает каждый менеджер, столкнувшийся с проблемой окаменевшего… «культурного слоя» из данных в проприетарных форматах, оседающего на дне корпоративных серверов и с трудом поддающихся «дешифровке» даже последующими версиями программ, которые их породили. То, что ИТ во все большей степени склонны дополнять «оборот»-перемещение возможностями «оборота»-(синхронной) групповой работы, усугубляет проблему еще на порядок и приводит к тому, что несоблюдение принципа сингл-сорсинга карается (экономически) очень строго.

TeXlive 6

TeXlive 6

Возможно, для кого-то еще большей новостью покажется то, что проблема сингл-сорсинга не только обсуждается, но и решается, причем в международном масштабе. После двух десятилетий (1960-80 гг.) интенсивного экспериментирования была проведена разработка и стандартизация универсального языка разметки SGML (принят в качестве стандарта ISO 8879 в 1986 г.). SGML пригоден для порождения языков описания текстового и прочего линейного (включая векторную графику, музыкальную нотацию и многое другое) контента.

Решается - успешно или нет? SGML оказался одновременно и удачей, и неудачей ИТ-сферы. Удачей - потому что он действительно хорош в смысле полноты возможностей и создания расширяемых приложений. Неудачей - потому что предъявил требования к вычислительным ресурсам, удовлетворить которые компьютерная отрасль смогла только спустя десять лет. Внедрение SGML оказалось растянутым и фрагментарным; фактически, можно говорить лишь об отдельных SGML-приложениях, получивших большее или меньшее распространение в отдельных, зачастую не связанных друг с другом областях знания и деятельности.

В литературе SGML и стандартизация описания контента упоминаются обычно в связи с HTML - языком разметки гипертекста, разные версии которого используются в WWW с начала 1990-х. Фокус в том, что HTML, перемешивая логическую и физическую разметку, не был чистым SGML-приложением вплоть до версии 4.0. Согласование HTML и SGML потребовало определенного изменения и SGML (впрочем, минимального), и HTML, а самое главное, такая постановка задачи привела к разработке XML - «легкой» версии SGML, ориентированной на наиболее массовые приложения, призванной обеспечить непротиворечивое вытеснение ранних версий HTML и приведение Сети к «общему знаменателю».

Перспективы сингл-сорсинга в сфере Интернет-технологий (постепенно поглощающих «документооборот» вообще и «офисный» документооборот в частности), открываемые SGML/XML (см. www.w3c.org и особенно www.oasis-open.org), делают вопрос о судьбе не-SGML-инструментария, включая TeX, весьма актуальным.

В главах 1, 6-8 Гуссенс и Ратц с помощью остальных авторов рисуют величественную картину «столкновения двух галактик»: TeX, в существенной степени опирающегося на PostScript (а сегодня - и на PDF) и традиционно ориентирующегося на полиграфию, и HTML/XML, ориентирующихся больше на электронные формы конечного представления контента. Авторы вводят исторический контекст, делают осторожные прогнозы и намечают ориентиры. Отнюдь не для всех задач, встающих перед предприятием, менеджер найдет готовые рецепты, однако максимально широкий угол зрения, представленный авторами, при вдумчивом изучении позволит обойти не только многочисленные очевидные «грабли» на пути сингл-сорсинга, но и избежать неочевидных «подводных камней».

Впрочем, анализ Гуссенса и Ратца я бы не назвал всеобъемлющим. В книге, «обсасывающей до последней косточки» технические вопросы, старательно (как мне показалось) обойдены все политические вопросы использования тех или иных средств, такие как проблемы с частным статусом спецификаций PostScript и PDF (их поддерживает компания Adobe, к которой серьезных претензий в связи с этим пока не возникало, но к которой существует масса вопросов по поводу заигрывания с медиа-отраслью [«и-букс», «шифрование» контента и прочее шарлатанство]). Конечно, вопросы эти всплыли лишь недавно, а вне профессиональной среды они обозначились, только когда оказались отброшены все рамки приличия (DMCA и «дело Склярова», в преследовании которого Adobe сыграла весьма неблаговидную роль), однако чтобы предвидеть их, не нужно быть большим провидцем. Подобным же образом игнорируются и странности в поведении Консорциума W3C, не могущего занять четкую позицию по поводу патентования алгоритмов (что ставит под удар целостность Сети), наблюдающиеся тоже не со вчерашнего дня.

Статус прав на рассматриваемые в книге программы упоминается лишь мельком, и в одном ряду фактически оказываются созданный TeXническим сообществом свободный софт (включая сам TeX Дональда Кнута) и проприетарные упражнения той же Adobe или IBM. А ведь свобода софта критически важна для сохранения единства сферы ИТ.

Это замечание к авторам (и к базовому компромиссу, объединившему столь по-разному ориентированных людей в качестве соавторов этой неординарной книги), к переводчикам же придраться трудно. Хотя и можно: резануло глаз использование слова «навигатор» в значении «браузер» (мне лично больше нравится калька «листалка», но она не прижилась) и прямолинейный перевод WWW как «Всемирной паутины» (вообще говоря, широкий читатель, не посещавший англоязычных университетов, не обязан знать, что Web - это сленг для «Вебстера» или вообще любого толстого и широко используемого словаря или справочника, и изначально Worldwide Web - это «всемирная энциклопедия», а «паутина» - вторичная аллюзия, однако профессиональный переводчик может и порыться в специальных словарях, включая словари сленга).

Впервые издание из серии «Библиотека издательских TeXнологий» сопровождается компакт-диском. К книге приложена русская версия TeX Live 6. Это шестое издание самого авторитетного в мире сборника софта и материалов, связанных с TeX, включая текущую версию полной TeX-системы в исходниках и готовых исполняемых файлах (для Linux и пяти других открытых систем, а также для Microsoft Windows), большую коллекцию TeX-макро и широкий выбор шрифтовых библиотек, много софта (в основном свободного), используемого обычно при TeXнической работе.

Русское издание TeX Live 6 под редакцией Бориса Тоботраса и Ольги Лапко дополнено пакетом русификации TeX и частичным переводом документации.

[i42658]


1 (обратно к тексту) - Ратц является соавтором (как и Хейко Обердик) пакета hyperref, предназначенного для внесения в LaTeX гипертекстовой разметки для последующего внесения в PDF; Гурари - основной автор TeX4ht, Мур - один из авторов LaTeX2HTML, а Сьютор руководит разработкой проприетарных компонентов techexplorer в IBM. Сотрудник CERN Гуссенс участвовал в стольких разработках, что и не упомнишь.
2 (обратно к тексту) - Must have (англ.) - «не смог купить, стащи».
3 (обратно к тексту) - Упомянутая книга - вторая в трехтомной серии, написанной Гуссенсом с различными соавторами. Ее перевод также готовится к выпуску в издательстве «Мир» под названием «Путеводитель по пакету LaTeX и его графическим расширениям». Первая книга, The LaTeX Companion, уже издана в 1999 г. под названием «Путеводитель по пакету LaTeX и его расширению LaTeX2e»; собственно, она и положила начало мировской серии «Библиотека издательских TeXнологий», в которой вышло на сегодня четыре книги, включая рецензируемую, первый «Путеводитель…», а также «Первые шаги в LaTeX» Георга Грэтцера (2000 г.) и «Шрифтовые технологии» Петера Карова (2001 г.; недавно «Компьютерра» опубликовала рецензию, см. #415 от 09.10.01)). Помимо остающейся книги Гуссенса нам обещают еще и «Компьютерную типографию» самого Дональда Кнута.
4 (обратно к тексту) - Так же, как и о подспудном сопротивлении, оказываемом медиа-отраслью, которая по мере «оцифровки» мира превращается из посредника, добавляющего стоимость, в препятствие, вычитающее стоимость.

This entry was posted in Компьютерра, рецензии and tagged . Bookmark the permalink.

Leave a Reply