Автор проекту pra.in.ua: За 5–10 років ці папери зітліють вкінець

Автор бази даних давніх мешканців України pra.in.ua — про те, як досліджував свій родовід, як отримує документи для поповнення бази та як шукати інформацію про своїх пращурів самостійно
25 липня 201713:26

Одразу після того, як база даних мешканців України 1650–1920 років pra.in.ua місяць тому з’явилась онлайн, її сервери “лягли”. Автори проекту розраховували на 7–10 тисяч відвідувачів на добу, натомість отримали по 70–80 тисяч. Були миті, коли прізвища в базі одночасно шукали 2500 людей. Ажіотаж засвідчив: українці почали активно цікавитись минулим своїх родин. Це підтверджують і все численніші звернення до архівів із музеями. Автор проекту Ігор Гошовський розповідає, як з’явилась ідея створити цю базу, які можливості вона дає, якої допомоги потребує — а також що робити, якщо рідних на сайті не знайшлось, а бажання дізнатись більше про свій рід не зникає. 

— Я історик за освітою, і ще з дитинства цікавився темою родоводу: моя бабуся дуже багато знала про своїх давніх родичів, і ще тоді передала мені чимале родове дерево. Я продовжував роботу, і в результаті зараз у дереві – чотири гілки на 10–11 поколінь кожна, разом з бічними гілками у ньому майже дві тисячі людей. Знайшов навіть копію грамоти 1383 року Ягайла, великого литовського князя та польського короля, якою він моєму пра-пра-пра… діду за військову вислугу подарував урочище Гошів, зараз це Івано-Франківщина. Його нащадки й називались Гошовськими.

 

Ігор Гошовський у 2009-му.

У процесі пошуку я працював не лише в архівах. Відчутно мені допомогли інтернет-ресурси. От тільки серед них не було жодного українського — переважно польські. Тож я часто ловив себе на думці, що поляки мають щастя користуватись для дослідження свого родоводу зручними й безкоштовними інтернет-ресурсами — а українці мало того, що мають ходити по архівах, змушені ще платити дурні гроші за сканування чи фотографування потрібної їм інформації.

Ідея визрівала кілька років, ще коли я працював журналістом та редактором. А потім, коли став співвласником IT-компанії — вирішив, що настав час усе втілити. На той момент уже було розуміння, що треба, аби проект міг працювати сам по собі — на кшталт "Вікіпедії". Запустити колесо  а далі воно щоб саме котилось. Тож за сім місяців розробки проекту ми внесли в базу певний обсяг даних, і розробили можливість її поповнювати. І за п’ять тижнів роботи проекту користувачі самі занесли до бази майже 300 тисяч людей на додачу до 2,5 мільйонів, що там були.

Звідки ми брали дані? Є десятки типів джерел: церковні метричні книги та сповідальні розписи, присяжні списки, списки репресованих та в’язнів концтаборів, списки вояків різних армій від Червоної до Австро-Угорської. Останні списки — показовий приклад того, як відбувається процес. До складу Австро-Угорщини входила Чехія, і кілька років тому чехи виклали в інтернет великий масив втрат цієї армії Опрацьовуючи ці списки, треба дивитись на місця народження людей. Якщо воно співпадає з територією України — ми додаємо людину в базу. Вже опрацьовано тисяч 12–13 із цього списку, ще 5–6 тисяч попереду. Це кропітка робота, яка триває роками. Втім, певний масив інформації по вояках цього періоду додають самі користувачі сайту, ще частину – інші дослідники.

 

Перелік документів, доступних для опрацювання волонтерами.

На системи автоматичного розпізнавання тексту ми не покладаємось: вони роблять помилки, і з урахуванням їх перевірки часу витрачається ще більше. До того ж, первинні матеріали дуже часто мають неякісний вигляд. Навіть якщо список робився на друкарській машинці — фарба вже розпливається.

Документи для роботи наші волонтери часом отримують, умовно кажучи, "нелегально", а саме — фотографують в архівах з-під поли, чи коли наглядач не бачить. Чому? Тому що, якщо в тій же Польщі держава часто виділяє кошти на систематичне сканування таких документів, на їхнє опрацювання й публікацію онлайн — у нас держава нічого не сканує й не опрацьовує, а документи помалу гниють. Натомість за кожен знімок на свій же телефон працівники архівів вимагають по 20–40 гривень. Це незаконно, це нонсенс — але, тим не менше, блокує можливість масової роботи. При тому, що ці папери й так за 5–10 років зникнуть, зітліють вкінець.

 

Сторінки з переліку підданих пана на Вінниччині, 1773 рік.

Що потрібно мати, щоб людина потрапила в базу? Мінімальні обов’язкові критерії — це прізвище, ім’я, якась хронологічна прив’язка. Якщо немає року народження — це може бути рік смерті, якщо ж нема і його — якась дата з життя людини. І четвертий обов’язковий фактор — географічна прив’язка: або місце народження, або місце смерті, або місце відомого проживання. Іще є довільне поле ”інфо”, в якій у форматі до 250 знаків можна написати, ким була ця людина, або джерело інформації.

Ми покладаємось на роботу волонтерів, більшості з яких я вже навіть і не знаю, адже наразі їх десятки, а можливо й сотні. В нас усе відбувається так: реєструється людина, бачить, що “висить” неопрацьований відсканований документ, робить заявку — і має тиждень на роботу. Далі я чи інші адміністратори перевіряють якість і відповідність форматуПотім ми масивом завантажуємо інформацію в базу.

 

Верхню планку в 1920-й рік поставили через питання захисту персональних даних. Зокрема, щоб не публікувати інформацію про живу особу без її на те згоди. Втім, зараз у базі вже чимало людей, народжених пізніше — але це внесли вже не ми, а користувачі сайту через свої родоводиУ правилах ми прописали, що якщо хтось не хоче, аби певна особа була в базі — вона пише нам запит на видалення, наводить аргументацію— і, якщо вона адекватна, ми без жодних питань видаляємо. Якщо ж особа, дані про яку хочуть видалити, належить до родового дерева якогось користувача — ми зв’язуємо цих людей, і далі вони вже розбираються між собою.

 

Зараз, щоб проект розвивався, ми шукаємо інвестицій. Нам треба збільшити обсяги обробки документів — наприклад, у Київській області збереглись переписні листи з перепису населення 1897 року. Там величезний масив — мабуть, на кілька мільйонів записів. Також є чималі масиви церковних метрик. Із тими силами, що зараз, тут роботи на десяток років. Ми хотіли б упоратись швидше. Тому шукаємо спонсорів. Також на сторінці проекту є можливість його підтримки жертводавцями. Ну й у кожного зареєстрованого на сайті є свій профіль, який можна доповнити бонусними опціями. Незабаром ми запустимо функцію чату, перетворившись на таку собі соцмережу. Вже зараз у ній понад сто тисяч користувачів. Також незабаром буде запущено функцію pra analytics — коли користувач зможе отримувати сповіщення у випадку якщо дані з його родоводу співпадатимуть з оновленнями в базі. Тобто, якщо буде ймовірність, що стало відомо про його нових родичів. Ця послуга також буде платною. 

Ми планували, що до кінця року база зросте до трьох мільйонів людей. Зараз ми бачимо, що завдяки волонтерам ці три мільйони в нас будуть до кінця літа — і ставимо на початок наступного року мету в 3,5 мільйони. А впродовж двох років думаємо дійти до п’яти мільйонів.

 

Якщо ж ви шукаєте інформацію про рідних, а пошук у базі нічого не дає, алгоритм може бути наступним. Наприклад, ви шукаєте прадіда. Ви маєте бодай приблизно розуміти, з якого він села та в яких роках жив, якого він року народження. Тоді ви йдете в архів, і як дослідник свого родоводу робите запит на те, щоб ознайомитись із метричними книгами чи списками парафіян по такому-то селу в такий-то діапазон років. Якщо ці документи є, вам обов’язково мають їх надати. Часом буває, що книги не збереглись. Зотліли, або знищили їх. Таке було: наприклад, у Вінницькій області величезний масив метричних книг у радянські часи чомусь засипали дустом. Зараз їх просто страшно відкривати.

Знайшовши інформацію про свого прадіда, про його дружину й дітей, ви можете затребувати книгу про те, де може бути ваш прапрадід. І так доти, доки не скінчиться цей фонд. Це залежить від регіону, але часто можна знайти інформацію по XVIII століття включно. А от далі даних майже немає. Якщо ви не маєте якогось шляхетського походження — і не просто шляхетського, а роду, який навіть серед шляхетства був високо — вже у XV-XVI століттях нитка губиться.

Записав Антон Семиженко.

Розділи :
Якщо ви знайшли помилку на цiй сторiнцi, видiлiть її мишкою та натисніть Ctrl+Enter
275
ПЕРЕГЛЯДІВ
1
КОМЕНТАРІВ

КОМЕНТАРІ

18.08.2017, 17:51
Додати

ГОЛОВНА ШПАЛЬТА

    • 15 серпня 2017

    Від Чорновола до Тимошенко: технології українських виборів у 12 історіях. Частина 1

    "Маленький секрет" однієї перемоги Тимошенко, "Танець пінгвіна" для "зелених" і вибори за 300 доларів - як це було у далекі 90-ті

     
    • 14 серпня 2017

    Високий сезон: 10 гарячих серіалів літа

    Міні-серіал від британця МакГоверна, який робив "Засуджених", історія постання американського стендапу, драмеді про жіночий реслінг і ще, ще, ще...

     
    • 14 серпня 2017

    Миллиарды в скважины. Кто взялся за бурение для “Укргаздобычи”

    Как проходил один из крупнейших в истории Prozorro тендеров — следил INSIDER

     
    • 11 серпня 2017

    Не арбузами едиными: как БПП, Батькивщина и Оппоблок не могут поделить Херсонскую область

    Такая конфигурация возникла осенью 2016 года и во многом связана с тем, что тогдашний глава облсовета Путилов не смог справиться с ситуацией в области.

     
Система Orphus