User:Crower/Archive 2010

From Wikisource
Jump to navigation Jump to search

Index:PL Słownik geograficzny Królestwa Polskiego i innych krajów słowiańskich. T. 1.djvu[edit]

hello, why is that book not on pl.wikisource ? ThomasV 06:13, 21 September 2010 (UTC)

Hi! The answer is here. -- Crower 08:06, 21 September 2010 (UTC)
I see. tanks ThomasV 08:09, 21 September 2010 (UTC)

Bobiatyn[edit]

Great job! Do you have an idea how to link these articles to corresponding articles in different Wikipedias (in this case to the Polish "Bobiatyn" and the Ukrainian "Боб'ятин")? Rembecki 16:28, 2 October 2010 (UTC).

This is good idea. I wanted insert something like {{wikipedia|pl:Bobiatyn}}, but can't find good variant and going to write new template. But i thought: on which wikipedia we should write link? If the link will point to plwiki and ukwiki, then why not to enwiki? And then it will point to the other rest, where an articles about Bobiatyn are present? So, I have not yet been finally decided how it should look best. -- Crower 03:23, 3 October 2010 (UTC)
I think, if the number of links gets above 10 (e.g. to "Kijów") we will have to limit them to the language of the country in which the place is located (e.g. Ukrainian), Polish and English. Rembecki 12:34, 3 October 2010 (UTC).
Ok. ...or it located in the country in the past. For example, in Hungary and Austria. :) So, we do not have to specify all interwiki, because there are determined by the importance of the article for lang-wiki. -- Crower 03:05, 6 October 2010 (UTC)
Well said. Nothing to add :-), Rembecki 10:24, 6 October 2010 (UTC).

Еще один вопрос: Почти доделал стр. 24, но ее нужно еще тщательно проверить. Ужасная работа - займет целые столетия, пока ее завершим. Может, начнем с индекса страниц? Можно при этом также использовать тот индекс, который мы уже начали здесь? Таким образом быстрее создадим нечто целое. Rembecki 18:34, 2 October 2010 (UTC).

Для начала, спасибо за исправления ошибок на моей странице. Я как та собака: всё понимаю, а сказать не могу. :) Точнее, что-то могу, а за чем-то приходится обращаться в словари и к гуглю, что не всегда оказывается грамотным.
Начать с индекса - правильная мысль. Но для меня она будет очень долгой. Впрочем, это зависит от того, в каком объёме её выполнять. Если только вписывать названия статец - легко. Если одновременно находить ссылки на статьи, то процесс оказывается очень долгий.
У меня сейчас другая интересная идея, которую я опробовал на своём локальном сервере - замечательно работает. Суть в том, что при оцифровке из djvu в proofread статьи уже появляются и не хватает механизма, автоматически состаляющего каталог этих статей, ну хотя бы по section, что-ли. Сейчас приходится делать много одной и той же работы вручную несколько раз:
  • писать название одной и той же статьи справочника (одновременно в параметрах begin и end тега section) не сложно, но и это можно упростить вспомогательным шаблоном, что я уже и делал;
  • писать основную статью со вставкой section, которая походит на другие аналогичные как близнецы кроме названия статии и номера тома - напрашивается ещё шаблон;
  • делать линковку с головной страницы тома на статьи, и между статьями...
Идея и работающий механизм позволил упростить создание статьи подстановкой одного шаблона. Даже без параметров! Для этого создаётся шаблон (назовём его Template:SgKP page params), содержимое может выглядеть так:

<noinclude>[[Category:Słownik geograficzny Królestwa Polskiego|*]]</noinclude>{{#switch:{{SUBPAGENAME}}
|Aa={{#switch:{{{1}}}|idx=1|page=19|endpage=19|prev=|next=Aahof}}
|Aahof={{#switch:{{{1}}}|idx=2|page=19|endpage=19|prev=Aa|next=Aal}}
|Aal={{#switch:{{{1}}}|idx=3|page=19|endpage=19|prev=Aahof|next=Aalbeck}}
|Aalbeck={{#switch:{{{1}}}|idx=4|page=19|endpage=19|prev=Aal|next=Aalfang}}
...


Для использования этого шаблона единстенная ручная работа - составление упорядоченного списка статей, из которого скрипт (или электронные таблицы) и генерят содержимое шаблона. Основной шаблон (назовём его Template:SgKP page) представляет собственно шаблон статьи, с переменными там где надо подставлять меняющиеся значения. Его содержимое будет выглядеть так:

<noinclude>
Template <nowiki>{{SgKP page params|param}}</nowiki> returns param for article with surname. Param can be:
: idx
: page - begin page
: endpage - end page
: prev - previous surname
: next - next surname
[[Category:Słownik geograficzny Królestwa Polskiego|*]]
</noinclude><includeonly>{{header
 title = [[{{#titleparts:{{PAGENAME}}|1}}|Słownik geograficzny Królestwa Polskiego<br />i innych krajów słowiańskich]]
 | author = Filip Sulimierski, Bronisław Chlebowski, Władysław Walewski
 | section = [[{{#titleparts:{{PAGENAME}}|2}}|{{#titleparts:{{PAGENAME}}|1|2}}]]
 | previous = {{#if:{{SgKP page params|prev}}|[[Słownik geograficzny Królestwa Polskiego/{{#titleparts:{{PAGENAME}}|1|2}}/{{SgKP page params|prev}}|{{SgKP page params|prev}}]]}}
 | next = {{#if:{{SgKP page params|next}}|[[Słownik geograficzny Królestwa Polskiego/{{#titleparts:{{PAGENAME}}|1|2}}/{{SgKP page params|next}}|{{SgKP page params|next}}]]}}
 | notes =
}}

<div class=indented-page style="margin-left:50px; margin-right:20px; text-align:justify;text-indent:2em;">
{{#tag:pages
||index="{{SgKP files|{{#titleparts:{{PAGENAME}}|1|2}}}}"
|from="{{SgKP page params|page}}"
|fromsection="{{SUBPAGENAME}}"
|to="{{SgKP page params|endpage}}"
|tosection="{{SUBPAGENAME}}"
}}
</div>

{{Template:PD-US-1923-abroad/PL}}

[[Category:Słownik geograficzny Królestwa Polskiego|{{SUBPAGENAME}}]]
</includeonly></nowiki>


Ещё один шаблон (Template:SgKP files) преобразует название тома в имя загруженного файла:

<noinclude>This template returns file name from tom number.
[[Category:Słownik geograficzny Królestwa Polskiego|*]]</noinclude><includeonly>{{#switch:{{{1}}}
|Tom I=PL Słownik geograficzny Królestwa Polskiego i innych krajów słowiańskich. T. 1.djvu
|Tom II=PL Słownik geograficzny Królestwa Polskiego i innych krajów słowiańskich. T. 2.djvu
|Tom is not specified.
}}</includeonly>

В итоге, на странице Słownik geograficzny Królestwa Polskiego/Tom I/Aahof вставляем шаблон {{SgKP page}} и Tak Alle! - шаблон сам подставляет название статьи, номер тома, название файла. Работу эту можно даже поручить роботу. Недостаток идеи, конечно, есть - невозможно будет индивидуально подправить статью, если в шаблоне не предусмотрели какой-то новый параметр. А ради одного мелочного изменения править (поручив это серверу) тысячи статей тоже не хочется. Тщательно взвесив все "за" и "против" можно шаблоном пользоваться временно, только для создания заготовки, подставляя содержимое из шаблона через {{subst:.... Это, конечно, позволит индивидуализироват статьи, хотя и оторвёт их от родительского шаблона. С другой стороны жёсткая привязка к шаблону позволит статьи сделать унифицированными, с единой схемой оформления. Если нужно поменять элементы оформления, то меняем только шаблон, а викисервер сам выполняет обработку всех статей по обновлённому шаблону. Правда, полторы десятка тысяч статей - это не мелочь, но при особой необходимости шаблоны по месту можно раздифинировать через {{subst:.... В любом случае уже одно это позволяет избавиться от огромного количества ручной работы, а значит оцифровка пройдёт гораздо быстрее. Я бы уже сделал эту часть работы, если бы не натолкнулся на один нюанс. Для того чтобы эта схема заработала на "ура" нужно обеспечить названия статей уникальным названием. Помнится я в самом начале создавал wiki-статью Boberka, в которую поместил две статьи словаря с таким названием. Мне показалось это хорошей идеей. Но кажется, кто-то разделил статью на статью о селе и статью о реке. Я бы принял это решение безучастно, но иногда в словаре встречаются статьи, которые объединяют информацию о нескольких населённых пунктах с одинаковым назваием, а рядом может находится другая статья с таким же названием о других населённых пунктах с тем-же названием. В результате просто невозможно придумать уникальное название для будущей статьи. С этой позиции мой первый вариант мне кажется более удобным - одна вики-статья на одно название (а не статью) словаря. Вопрос что делать со статьями с одним названием в разных томах (которые могут повторяться в томе 15 части 1 и 2), можно было бы решить разделеним шаблона (например, {{SgKP page params}}) на несколько шаблонов - по одному на каждый том. Ещё индивидуализацию статьи можно было бы сделать, подставляя переменные части не изнутри шаблона на основании названия стать по справочному шаблону, а передавая их при вызове статьи. Тогда можно было бы подставлять, например, ссылки на википедийные статьи, в самой статье, не вызывая цепную реакцию обновления всех статей при обновлении шаблона. Например, в {{SgKP page}} добавляем параметр: | notes = {{{1|}}}, а в статью вместо {{SgKP page}} добавляем {{SgKP page|notes=[[pl:w:Bobiatyn|Bobiatyn]], [[uk:w:Боб'ятин|Боб'ятин]]}}. Тогда будут "и волки сыты, и овцы целы" ;) -- Crower 03:23, 3 October 2010 (UTC)

Я не знаток скриптов, но все это выглядит очень заманчиво. Я бы поначалу делал по Вашим шаблонам, а там уже будет виднее. Мне кажется, что все одноименные статии изо всех томов должны быть в одном месте - одноименные статьи нужно дописывать к созданным прежде. Потом, когда первый шаг будет проделан, подумаем как их разделить на меньшие куски. Покамест, там где под одним названием выступает 15 разных объектов, ссылки на разные википедии должны быть посередине текста, в 15 абзацах. 'В тексте' можно также добавить справку о том в каком томе и на какой странице находится исходное содержание. Rembecki 12:34, 3 October 2010 (UTC).

В том-то и дело, что пока не совсем понятно какую схему выбрать. А если начать работать по любой из них в надежде на то, что "потом переделаем", то может оказаться что новая схема несовместима со старой на столько, что переделывать придётся очень много. Мысли вслух:
  1. Наверняка можно сказать, что не придётся переделывать оцифровку страниц словаря, тот текст что на страницах "Page:", без оформления и дополнительных тегов. Точнее, оформление (выделение жирным шрифтом или курсивом, отступы {{gap}}, подписи авторства и шаблоны для переносимых слов - {{Hyphenated word start|пере|перенос}} и {{Hyphenated word end|нос|перенос}}) можно будет и не переделывать. Подписи, правда, намереваюсь довести до ума - сделать шаблон, в котором прописать такие стили для div или другого тега, чтобы она оставалась в той же строке и при этом, находясь в коде на той же строке что и предыдущий текст не прореживала строки предыдущего абзаца. Пробовал использовать шаблон для оцифровываемых статей словаря. С одной стороны было бы удобно не прописывать названия секций в begin и end (где можно ошибиться лишний раз). а с другой - часть оформления (тот же отступ) зашить в шаблон. Но проблема подкралась с неожиданной стороны: если использовать тег section, то в шаблоне обработка тега происходит раньше чем подстановка параметра в название, а если через {{#tag:section..., то оказалось что парсер не умеет раскрывать самостоятельные теги, а вставляет всегда открывающий+закрывающий. Провозился, и нашёл вариант только для облегчения работы, подставляя шаблон с subst:, а теги вместо "<" и ">" обозначивал простым круглыми скобками. После сохранения остаётся только заменить скобки.
  2. Если создавать одну вики-страницу на название (что я в самом начале пытался сделать), то задача упрощается. Можно section begin ставить перед первой статьёй определённого названия, а section end после последней и упомянутые выше шаблоны подойдут. А можно секции выделять как сейчас, но при создании вики-статьи в теге pages указывать начало первой секции и конец последней. Удобство в том, что при желании где угодно можно по-прежнему вытащить только одну статью оригинального словаря, но при этом шаблон с параметром придётся доработать, добавив название завершающей секции. Я то полагал, что можно обойтись одим названием и на странице вики-словаря, и в названии секции, что потребовало кропотливого подхода к именованию. А здесь тогда можно секции одноимённых статей оригинального словаря именовать как попало, но тогда и шаблон с параметрами нужно будет расширять всё-равно.
  3. Если собирать все одноименные статьи в одну вики-страницу, то тогда теряется смысл создания их как подстраницы тома, являющегося в свою очередь подстраницей словаря. Я в шаблоне применил хитрость, не передавая номер тома в качестве параметра, а беря его из имени страницы. А здесь понадобится этот параметр брать откуда-то ещё. Либо вносить вручную, либо (что будет сделано скорее всего) из всё того же многотерпеливого шаблона параметров статей. В принципе, одна из предыдущих версий шаблона содержала у меня и номер тома - ничего страшного. Но это ещё прибавка к его объёму. Даже не знаю как скажется существенное увеличение размера шаблона на быстродействии. И сейчас я пока даже не представляю, каким образом в придуманную уже схему заложить возможность собирать секции, расположенные не подряд, а через разрыв, а уж тем более, в разных томах. Всё это не лучшим образом скажется на быстродействии и объёме параметрических шаблонов. Если при существующей схеме шаблоны можно было бы создавать по одному на каждый том (со всеми вытекающими из этого преимуществаим), то сейчас всё собрано будет в одном шаблоне, либо придётся придумывать методику искусственного разделения информации.
Продолжаю обдумывать как можно автоматизировать процесс создания собственно статей. Пока можно подытожить:
  • Обработку страниц (в пространстве Page:) можно смело продолжать, включая оформление.
  • Каждой статье словаря собственную секцию. Предлагаю называния секций одноимённых статей именовать, прибавляя к имени число. Т.е. первая статья в секции с названием, например, Aleksandrów по названию статьи, а дальше Aleksandrów1, Aleksandrów2, Aleksandrów4.
Дальше ещё предстоит решить создавать ли страницы как подстраницы свого тома, как сделано сейчас, (например, Słownik geograficzny Królestwa Polskiego/Tom I/Bobica), или собирать их в кучу (делая подстраницами Słownik geograficzny Królestwa Polskiego). Нужно ли будет оставлять разбиение по томам хотя бы на головной странице словаря, или фактически привести в тот же вид, который имеет словарь в википедии - организация строго по алфавиту.
Пока я склоняюсь к тому, чтобы оставить статьи разложенными по томам. Выйти на нужную статью можно и через головную страницу, так как указан алфавитный диапазон, и через поиск. А для статей, названия которых упоминаются в дополнительных томах можно указывать викиссылку на статью в соседнем томе в поле notes так же, как предлагалось делать ссылки на статьи в википедиях. -- Crower 03:05, 6 October 2010 (UTC)
Во первых - Вам виднее. Я сам мало смог понять с того что написано выше - я точно лучшей альтернативы не предложу. Вполне полагаюсь на Вас.
Словарь создавался так как создавался. Ограничения, которые дает процесс издательства бумажных томов, содержавших результат двадцатилетней работы, заставляли читателя искать по разным, тяжелым томам. Сегодня поиск гораздо проще, значит и надобность строго алфавитного порядка пропадает. Таким образом, если это облегчает работу, можно и оставить первоначальную структуру текста. Rembecki 10:24, 6 October 2010 (UTC).

Wola[edit]

  • Для примеру: Статьей "Wola" там довольно много. В томе 13 поначалу общая статья про название. Потом, в следующей статье 626 деревень в Царьстве Польском. В следующей 22 в Литве. В еще одной - речка на Волыни. Потом 50 штук Волей на Волыни. Еще две горы в Галиции. В следующей статье - деревень 167 штук в Галиции (в том числе длинная подстатья - Wola Jakubowa). Еще река в Галиции. Потом 5 деревень в Словакии. 16 деревень в Познанском Княжестве. 7 деревень в Поморие. 11 в Мазурии.
  • Потом еще в томе XV_cz.2 - 79 штук в ЦП, 5 на Волыни, 26 в Галиции.... Номеров придется доделывать жутко много... Rembecki 10:19, 8 October 2010 (UTC).
=:-O Жуть. ;) Какие предложения? -- Crower 13:27, 8 October 2010 (UTC)
Превоначально я заключал одноимённые статьи в одну секцию. При таком подходе в викиисточниках статьи-подстраницы с названием Wola было бы ровно две - одна в тринадцатом томе, а вторая - во второй части пятнадцатого. Никаких нумераций. зато как прописать (в теории) ссылки на 626 страниц википедий непонятно. В загловке однозначно не получится. Надо придумать как делать изящно ссылки в тексте сразу на несколько википедий. -- Crower 13:40, 8 October 2010 (UTC)

Да, вот это и нужно предусмотреть. Ссылки на разные википедии в подразделах статьей. И проблема, скорее всего, не в том как это сделать, только (если бы это была польская Википедия, былабы точно) в том как это объяснить админам, которые утвержают, что внешние ссылки должны содержаться только в заглавии. Rembecki 20:17, 8 October 2010 (UTC).

Если админы не согласятся, то единственный выход - разделять статья на подразделы. -- Crower 13:46, 9 October 2010 (UTC)
У меня нет опыта работы в международном Викисорсе. Может здесь у народа более реалистические взгляды и все это удастся проделать так как хотим? Сегодня я уезжаю на каникулы - до встречи через неделю! Rembecki 16:53, 9 October 2010 (UTC).
Приятного отдыха. :)
У меня процесс торомозится тем что не знаю как называть некоторые одноимённые статьи. В секциях ещё можно приписывать цифры к названию, так как внешне это не видно. Тем статьям (из многозначных), в которых описан один объект, можно давать название, включая в него обобщающую или уточняющую категорию (например, повет, озеро и т.д.). Если среди одноимённых статей все кроме одной (с несколькими подстатьями) имеют уточнённое название, то эту одну статью можно оставить с таким названием как есть - она и так отличается. Но если их набирается две и больше, тот тут нужно напрягать фантазию, и выискивать некие обобщающие и уточняющие названия, чего мне зачастую не удаётся. :(
В связи с этим пока кое-как заполняю индекс (так лучше думается), и задумываюсь над тем, может быть действительно здесь имеет смысл статьи в викиисточниках делать по подстранице на название. Вот сейчас только пришла идея: Например, имеем в словаре пять статей Annopol. Делаем одну подстраницу вики-словаря (Słownik geograficzny Królestwa Polskiego/Tom I/Annopol или Słownik geograficzny Królestwa Polskiego/Annopol), в которую включаем все статьи с этим названием. Но при этом создаём и для неё подстраницы с уточняющими названиями (соответственно, например, Słownik geograficzny Królestwa Polskiego/Annopol/powiat braclawski и так далее). Эти последние подстраницы можно оформить как включаемые шаблоны с <noinclude> и так далее таким образом, что заголовок у них будет свой у каждой, но ссылки на википедии можно оставить вне секции с <noinclude> вместе с текстом статьи словаря. Таким образом, можно будет в подстранице Annopol включить как шаблоны все её подстраницы и ссылки на википедийные статьи тоже будут включены. Если развивать идею дальше, то можно было бы и для статей, где есть несколько подстатей создать подстраницы, в каждой из которых будет своя секция. Таким образом, началом и концом секции нужно будет обозначать не статью, а каждую подстатью. И даже ссылки на википедии можно было бы давать каждой подстатье индивидуально. Подстраницам этим, кстати, можно было бы давать название и по номеру, под которым эта подстатья опубликована в словаре, либо с уточняющим названием. Это можно обсудить какой из вариантов лучше.
Вот эта, самая свежая идея мне больше всего нравится. Rembecki 09:40, 14 October 2010 (UTC).
Если бы она была самой последней. ;) А как на счёт вот такой (или как здесь) организации словаря? -- Crower 05:53, 15 October 2010 (UTC)
Пока собираю индекс, предварительно занося названия статей (а также вспомогательную информацию) в таблицу OpenOffice. Поэтому то что уже сделано, не пропадёт и будет использовано даже если конечное решение, какой вид должен иметь вики-словарь, будет отличаться от текущего ви́дения. -- Crower 01:53, 12 October 2010 (UTC)
Да, вот, само создание индекса это уже громадная работа... Rembecki 09:40, 14 October 2010 (UTC).