Форум 3DNews
Вернуться   Форум 3DNews > Общие форумы > Общие проблемы

Ответ Создать новую тему
Опции темы Опции просмотра
Непрочитано 02.03.2006, 18:02   [включить плавающее окно]   #1
NaimaD
Мужской Опытный
Автор темы
 
Аватар для NaimaD
 
Регистрация: 22.10.2003
Адрес: Москва
создание электронного архива

Не знал, куда постить, посему пишу сюда...

В общем... Начальство поставило задачу: подумать, как можно организовать создание электронного архива имеющихся документов (думаю где-то около миллиона (а то и больше) страниц печатного текста).

Вот я теперь как Иванушка сижу и горючи слёзы лью: поди туда, не знаю куда, принеси то, не знаю что...

Есть ли какой-нить, может, софт который помог бы сортировать такое количество документов?

Или, на крайняк, какая-нить компания, которая могла бы заняться подобной архивацией?

Или толпа фрилансеров...?

Может хоть кто-то какую-то идею подкинет? Вообще любое предложение? Я даже не знаю, с какой стороны взяться....

Чувствую себя идиотом
NaimaD вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 02.03.2006, 18:14   [включить плавающее окно]   #2
Vanya
Мужской Недосягаемый
 
Аватар для Vanya
 
Регистрация: 24.11.2003
Адрес: Наукоград Пущино
А что с ними делать надо?
Сканировать-распознавать?
сортировать по имени, дате содержимому?
Или базу из них делать?

Хоть примерно..

Vanya добавил :

Если по минимуму, поиск по содержимому doc и подобных файлв, подойдет "Персональный поиск яндекс"
Это локальный движок яндекса
__________________
Признайся себе, что тебе в этот момент меньше всего хочется делать
и сделай это.
Vanya вне форума  
Ответить с цитированием
Непрочитано 02.03.2006, 22:10   [включить плавающее окно]   #3
NaimaD
Мужской Опытный
Автор темы
 
Аватар для NaimaD
 
Регистрация: 22.10.2003
Адрес: Москва
Цитата (Vanya) »
А что с ними делать надо?
Надо создать электронные копии всех документов (просто скан, можно без распознавания), вместе с подписями, печатями итд итп...

Цитата (Vanya) »
сортировать по имени, дате содержимому?
Скорее, по типу документа, принадлежности к тому или иному клиенту... В том-то и загвоздка - это скорее ручная работа

Цитата (Vanya) »
Если по минимуму, поиск по содержимому doc и подобных файлв, подойдет "Персональный поиск яндекс"
Это локальный движок яндекса
Ну, нет, не совсем то, я думаю...

Вот, нашёл такую штуку: http://www.elar.ru/. Тогда остаётся другая проблема: как и где всё это чудо хранить? Тот же Элар на выставке Инфосекьюрити 2005, помнится, представлял систему архива, построенную на куче ДВДшек-RW. А как бэкапить всё это? Объём там должен получиться весьма приличный (думаю, выходной формат будет PDF).
К тому же, пока нет возможности перегонять большое кол-во инфы на удалённый сайт, потому что офис подключен на 128к
NaimaD вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 03.03.2006, 09:36   [включить плавающее окно]   #4
Vanya
Мужской Недосягаемый
 
Аватар для Vanya
 
Регистрация: 24.11.2003
Адрес: Наукоград Пущино
NaimaD
Цитата (NaimaD) »
Надо создать электронные копии всех документов (просто скан, можно без распознавания), вместе с подписями, печатями итд итп...
Фирм не знаю, но есть рульные сканеры с автоподачей документов.
Переиздавали книгу, 2 тома 450 страниц. Вот ее разрезали и в этом сканере отсканировали-распознали за два неполных рабочих дня
Сканер HP ScanJet 7450. Это если сканировать на месте.
А так можно студентам поручить - пусть сканют
Прикинуть цифры - ~10 страниц в минуту = 1700 часов - 210 человекодней
7 человек за месяц сделают.

Стоимость скана у меня в институте (в ларьке) от 2 до 5 рублей

Цитата (NaimaD) »
Скорее, по типу документа, принадлежности к тому или иному клиенту
Это хорошо бы сделать организационно - до сканирования разобрать по кучкам

Цитата (NaimaD) »
как и где всё это чудо хранить?
винты рулят.
Если прикинуть - 1 файл- 1 мег.
976 гиг
207 DVD
Четыре винта по 250 гиг imho лучше.
бэкап на стриммер

И еще пока ты ничего не испортил поправлю. Если сканируешь и оставляешь изображением, ни в коем случае не запихивай в pdf. Оставляй как есть, (tif, jpg с высоким качеством и т.п.) pdf - больше для вектрного текста нужен. Если только растр

Еще. Если будешь оставлять растр - обращайся до сканирования, расскажу основы атоматической чистки большого количества файлов
__________________
Признайся себе, что тебе в этот момент меньше всего хочется делать
и сделай это.
Vanya вне форума  
Ответить с цитированием
Непрочитано 03.03.2006, 10:10   [включить плавающее окно]   #5
NaimaD
Мужской Опытный
Автор темы
 
Аватар для NaimaD
 
Регистрация: 22.10.2003
Адрес: Москва
Цитата (Vanya) »
Сканер HP ScanJet 7450
Стоит 5590. Но объём не тот, чтобы так это всё сканировать... Вообще, смешно получилось.

-Посмотри нам сканер побыстрее
-То есть??
-Ну, чтобы сканировал побыстрее, чем этот
-А зачем?
-Хотим наш архив отсканировать
-

Цитата (Vanya) »
Это хорошо бы сделать организационно - до сканирования разобрать по кучкам
Ну, безусловно... Естесственно, что всё уже разбито по папкам, наверное похожая структура и останется...

Цитата (Vanya) »
винты рулят.
Если прикинуть - 1 файл- 1 мег.
976 гиг
207 DVD
Четыре винта по 250 гиг imho лучше.
бэкап на стриммер
Ну, винты-то рулят...
А вот с бэкапом, извини, не понимаю: я свои 72 ГБ не могу на стриммер впихнуть (36 ГБ максимум на касету влезает), а сколько же мне кассет-то понадобится? И сколько времени займёт одно копирование, если 36 ГБ пишутся около трёх часов? Может, посоветуете что-нибудь, а то я по стриммерам не спец

Цитата (Vanya) »
Если сканируешь и оставляешь изображением, ни в коем случае не запихивай в pdf. Оставляй как есть, (tif, jpg с высоким качеством и т.п.) pdf - больше для вектрного текста нужен.
Да, я прекрасно себе представляю разницу между вектором и растром, как, впрочем, и между ТИФом, ДЖПЕГом и ПДФом С ПДФом юзерам работать удобнее, можно устанавливать параметры безопасности (типа запрета на печать) и он не сильно большой по размеру получается (при хорошем качестве). Так что лучше пусть будет ПДФ...

Цитата (Vanya) »
основы атоматической чистки большого количества файлов
Хммм, а поподробнее?
NaimaD вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 03.03.2006, 10:27   [включить плавающее окно]   #6
Vanya
Мужской Недосягаемый
 
Аватар для Vanya
 
Регистрация: 24.11.2003
Адрес: Наукоград Пущино
Цитата (NaimaD) »
Стоит 5590. Но объём не тот, чтобы так это всё сканировать... Вообще, смешно получилось.
http://xcom-shop.ru/files/4330578ba15309.25039759
второй с автоподатчиком. Емкость страниц 50. 10 страниц в минуту
Есть и быстрее, вроде


Цитата (NaimaD) »
основы атоматической чистки большого количества файлов
В кратце - все сканируется с одинаковыми настройками
Потом в Photoshop делается action чистки (levels, curves, color, resolution, file format, save)
А потом ЭТО делается через Photoshop batch со всеми файлами.

Конечно кто-то предложит "делать все в автомате, типа сканер сам все настроит" но лично мне это не нравится
__________________
Признайся себе, что тебе в этот момент меньше всего хочется делать
и сделай это.
Vanya вне форума  
Ответить с цитированием
Непрочитано 03.03.2006, 10:42   [включить плавающее окно]   #7
NaimaD
Мужской Опытный
Автор темы
 
Аватар для NaimaD
 
Регистрация: 22.10.2003
Адрес: Москва
Цитата (Vanya) »
второй с автоподатчиком. Емкость страниц 50. 10 страниц в минуту
Есть и быстрее, вроде
Да, он от нашего не сильно отличается. На 5590 тоже стоит автоподатчик точно такой же
У того же Элара промышленные сканнеры, до 180 стр/мин... Да и не покупать же ещё 6 сканнеров, чтобы "7 человек за месяц управились"
NaimaD вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 03.03.2006, 10:50   [включить плавающее окно]   #8
Vanya
Мужской Недосягаемый
 
Аватар для Vanya
 
Регистрация: 24.11.2003
Адрес: Наукоград Пущино
NaimaD
Вторая часть похоже про тебя
http://www.korova.ru/humor/viewer.php?id=3170&types=t

Vanya добавил :

PS 5590 я думал это цена
__________________
Признайся себе, что тебе в этот момент меньше всего хочется делать
и сделай это.
Vanya вне форума  
Ответить с цитированием
Непрочитано 03.03.2006, 10:58   [включить плавающее окно]   #9
Lamo
Женский Заслуженный
 
Аватар для Lamo
 
Регистрация: 26.02.2003
Адрес: _________________ Valley of Damned Soul
NaimaD
жестко это тебя
Цитата
Чувствую себя идиотом
в такой ситуации и не только ты
__________________
Вот что я вам скажу. Позвольте мне немножко подсластить вам сделку
(Вельзевул)
Lamo вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 03.03.2006, 11:29   [включить плавающее окно]   #10
NaimaD
Мужской Опытный
Автор темы
 
Аватар для NaimaD
 
Регистрация: 22.10.2003
Адрес: Москва
Цитата (Vanya) »
Вторая часть похоже про тебя
Супер

Цитата (Lamo) »
в такой ситуации и не только ты
Ну, я понимаю... Но что делать-то?


Кстати, Lamo, может подскажешь, как бэкапить такой объём данных? Сколько максимум на стриммеры влезает (с учётом возможности использования многозарядных стриммеров)?
NaimaD вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 03.03.2006, 11:32   [включить плавающее окно]   #11
Lamo
Женский Заслуженный
 
Аватар для Lamo
 
Регистрация: 26.02.2003
Адрес: _________________ Valley of Damned Soul
NaimaD
Цитата
может подскажешь, как бэкапить такой объём данных?
для начала вопрос - насколько часто это делать нужно?
__________________
Вот что я вам скажу. Позвольте мне немножко подсластить вам сделку
(Вельзевул)
Lamo вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 03.03.2006, 11:37   [включить плавающее окно]   #12
NaimaD
Мужской Опытный
Автор темы
 
Аватар для NaimaD
 
Регистрация: 22.10.2003
Адрес: Москва
Цитата (Lamo) »
для начала вопрос - насколько часто это делать нужно?
Я думаю, что должно хватить одного полного и еженедельного дифференциального каждый месяц. Может быть, даже чуть реже - документы не очень часто добавляются.
NaimaD вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 03.03.2006, 14:14   [включить плавающее окно]   #13
Lamo
Женский Заслуженный
 
Аватар для Lamo
 
Регистрация: 26.02.2003
Адрес: _________________ Valley of Damned Soul
NaimaD
Вообще-то каждый тип документов имеет свой срок архивного хранения,
тут все в _организацию_ этого дела упирается, а не в бэкап.
Полный бэкап - раз в квартал по самое нехочу,
Объем... вот будет ли конечный документ хоть немного сжиматься?
Цитата (NaimaD) »
Сколько максимум на стриммеры влезает (с учётом возможности использования многозарядных стриммеров)?
много
http://desc.allshops.ru/514/5147673.html
http://www.it-legion.ru/index.php?productID=31048

нравятся мне эти РУКОводители -
бзданут, воздух испортят, а задыхаются другие
__________________
Вот что я вам скажу. Позвольте мне немножко подсластить вам сделку
(Вельзевул)
Lamo вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 03.03.2006, 15:40   [включить плавающее окно]   #14
NaimaD
Мужской Опытный
Автор темы
 
Аватар для NaimaD
 
Регистрация: 22.10.2003
Адрес: Москва
Цитата (Lamo) »
каждый тип документов имеет свой срок архивного хранения
Ну, это-то да. По истечение срока давности и потери актуальности, думаю, документ будет просто переноситься перманентно на диск какой-нить...

Цитата (Lamo) »
Полный бэкап - раз в квартал по самое нехочу
Согласен, в принципе...

Цитата (Lamo) »
Объем... вот будет ли конечный документ хоть немного сжиматься?
Если будет ПДФ, то вряд ли больше, чем на 5% - внутри будет не текст, а картинки.

Цитата (Lamo) »
много
Ага. Только вот они точно стоят как чугунный мост через атлантику Впрочем, это не мои проблемы.

Цитата (Lamo) »
нравятся мне эти РУКОводители -
бзданут, воздух испортят, а задыхаются другие
А что, бывает иначе?
NaimaD вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 04.03.2006, 03:10   [включить плавающее окно]   #15
LeXiy
Мужской Продвинутый
 
Аватар для LeXiy
 
Регистрация: 05.08.2005
Адрес: Тамбов
Со стримерами не сталкивался, но мне кажется винтов с зеркалированием пока будет достаточно. С ростом архива докупать винты или большего размера взамен старых. А бакапить на другой комп. Так проще для тебя. А это должно быть главным для тебя в такой ситуации. Начальство ставит задачу - ты выбираешь путь наиболее легкий или наиболее интересный для тебя. А уж вопрос денег пусть заботит начальство. Есть деньги - будешь реализовывать, нет - докажи, что иначе ни как нельзя. Так будет проще тебе.
__________________
Лень простого русского человека — это не грех, а совершенно необходимое средство нейтрализации кипучей активности руководящих дураков.
LeXiy вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 04.03.2006, 15:03   [включить плавающее окно]   #16
NaimaD
Мужской Опытный
Автор темы
 
Аватар для NaimaD
 
Регистрация: 22.10.2003
Адрес: Москва
Цитата (LeXiy) »
Со стримерами не сталкивался, но мне кажется винтов с зеркалированием пока будет достаточно. С ростом архива докупать винты или большего размера взамен старых. А бакапить на другой комп. Так проще для тебя. А это должно быть главным для тебя в такой ситуации. Начальство ставит задачу - ты выбираешь путь наиболее легкий или наиболее интересный для тебя. А уж вопрос денег пусть заботит начальство. Есть деньги - будешь реализовывать, нет - докажи, что иначе ни как нельзя. Так будет проще тебе.
Нет. Смысл в том, что должен быть бэкап на переносной носитель - чтобы можно было сделать копию и унести её из офиса, а в случае какого-нибудь катаклизма (скажем, серверная сгорела) восстановить все данные. Я не зря сказал, что нет возможности перегонять инфу через интернет - канал тонкий.
Да и в любом случае, если местом основного хранения будет выбран сервер с HDD, то там будет РЭЙД5, иначе бессмысленно всё это делать.
NaimaD вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 05.03.2006, 03:04   [включить плавающее окно]   #17
LeXiy
Мужской Продвинутый
 
Аватар для LeXiy
 
Регистрация: 05.08.2005
Адрес: Тамбов
NaimaD Полностью согласен.
__________________
Лень простого русского человека — это не грех, а совершенно необходимое средство нейтрализации кипучей активности руководящих дураков.
LeXiy вне форума  
Конфигурация ПК
Ответить с цитированием
Непрочитано 08.08.2006, 14:23   [включить плавающее окно]   #18
astarodubcev
Мужской Новенький
 
Регистрация: 08.08.2006
Адрес: Санкт-Петербург
Вот, есть еще такая компания: http://www.alee-archive.ru, которая
занимается подобной архивацией. Поставляет и программное обеспечение, и оборудование для хранения (Raid), и сканирует (http://www.scandocs.ru).
astarodubcev вне форума  
Ответить с цитированием
Непрочитано 09.08.2006, 15:02   [включить плавающее окно]   #19
falc
Мужской Абсолютный
 
Регистрация: 03.03.2003
Адрес: Moscow city
У меня студент работал в конторе, которая профессионально занимается переводом документов в электронный вид. ИМХО в данном случае заключить договор с подобной фирмой - самый правильный выход.
__________________
Лучшее - враг хорошего. И нет ничего лучше, чем когда все хорошо...
falc вне форума  
Конфигурация ПК
Ответить с цитированием
Ответ Создать новую тему

Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 04:14. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2020, Jelsoft Enterprises Ltd. Перевод: zCarot
Copyright © 2000-2017 3DNews. All Rights Reserved.
Администрация 3DNews требует соблюдения на форуме правил и законов РФ
Серверы размещены в Hostkey