В бюро Фларус я уже много лет занимаюсь локализацией веб-сайтов и написал много заметок по этой теме. Поэтому для особо интересующихся есть сервис для поиска в правой части этого проекта, которым можно воспользоваться для изучения нашего опыта и опубликованных документов.
Сейчас же я хотел остановиться на одном единственном, но самом важном вопросе - как выполнить экспорт текстовой части веб-сайта? Конечно, есть не менее важные задачи по импорту контента, финальной вычитке текстов сайта носителем языка, отладки интерфейса и функциональных элементов сайта, но вопрос экспорта стоит всегда первым. Без этого решения все остальные действия попросту не нужны.
Прежде всего надо понимать, что современные сайты не содержат текстовой информации на своих страницах. Большинство сайтов получают эту информацию из базы данных, часть данных формируется в процессе запросов и манипуляций пользователя сайта. Поэтому экспорт текстов порой представляет ощутимую проблему для клиентов бюро переводов.
Я остановлюсь на самом распространенном случае - связке сайта на языке программирования плюс базы данных mySQL. На данный момент это наиболее популярный формат хранения данных в интернете.
В базе данных тексты размещены под уникальными идентификаторами. Не заостряя внимания на их типе, можно сказать, что экспортировать контент сайта всегда необходимо с этими идентификаторами. В противном случае последующий импорт переведенных текстов будет осложнен, а в некоторых случаях даже невозможен.
Большинство провайдеров и хостингов предлагает бесплатный инструмент для доступа и работы с базой данных сайта, это phpmyadmin.
Для экспорта необходимо разобраться, какие таблицы в базе данных содержат тексты страниц сайта, какие отвечают за служебные и вспомогательные элементы. Например, пункты меню сайта, элементы выпадающих списков, выбора - могут находиться в разных таблицах.
В помощь предложу краткий глоссарий по локализации веб-сайтов и формату XML, собранный редактором терминологического отдела и машинного обучения в нашем бюро.
Для примера приведу дамп таблицы, в которой информационным полем является лишь одно, остальные - служебные, а значит, для экспорта и перевода не нужные:
Получив доступ к базе данных веб-сайта, мы можем экспортировать поля текстовых таблиц в формате sql, xls или любом другом, который может быть прочитан текстовым редактором. Для этого воспользуйтесь вкладкой "Export".
То, что в дамп попадет много лишней информации, в данном случае не важно. Наши редакторы и переводчики работают в специальной программе, которая подсвечивает только нужную текстовую информацию, оставляя (и это очень важно) остальное без изменений. И именно эти тексты учитываются менеджером при расчете стоимости перевода веб-сайта.
Примечание: в некоторых компаниях существует административный доступ к базе данных веб-сайта с разделенными правами. Интерфейс не подразумевает прямого доступа, а позволяет производить лишь избранные действия – экспорт, например. В этом случае мы могли бы самостоятельно сделать дамп контентной части сайта, для чего нам понадобится адрес административной части веб-сайта, логин и пароль.
Получив текст, который представляет собой примерно это:
мы можем отправить файлы на просчет стоимости перевода менеджеру бюро. Еще раз отмечу, что для просчета будет учтен только информационный текст, служебный останется без изменений.
Процесс перевода дампа не является темой этой заметки, но я обязательно напишу о нем позже. Можно подписаться на наши публикации на сайте или вступить в группу бюро переводов ВКонтакте, чтобы оперативно отслеживать новости.
Для примера переведем дамп сайта на испанский язык:
После выполнения перевода дамп нужно импортировать обратно в базу данных веб-сайта. Об этой процедуре в моей следующей публикации.