"... когда я был в Сибири в ссылке, мне приходилось быть адвокатом. Был адвокатом подпольным, потому что я был административно-ссыльным и это запрещалось, но так как других не было, то ко мне народ шел и рассказывал о некоторых делах".
В. И. Ульянов-Ленин
Русский   English
адвокат
КОЖЕМЯКИН АНДРЕЙ ЮРЬЕВИЧ

  • Будущее юридической профессии: как работает предиктивное кодирование

27 Июл, 2013

Что это за технология и зачем она нужна?

В общем виде предиктивное кодирование (ПК) — это процесс изучения документов с помощью вычислительной техники. В процессе используются алгоритмы идентификации, анализа, сортировки и приоритизации документов, результатом является организованный набор документов, интересующих пользователя, сформированный и отсортированный в соответствии с заданными им параметрами.

Эта технология позволяет значительно ускорить и удешевить анализ больших объемов данных; особенно она полезна для сложных гражданских делах. Однако на сегодняшний день эта технология пока не может полностью заменить человека.

Кому и какую пользу она приносит?

Участникам процесса — тем, кто заказывает юридические услуги, и тем, кто их предоставляет. Во-первых, в сложных делах каждый день, прошедший до принятия судом решения по делу, может дорого стоить как истцу, так и ответчику, в прямом и переносном смысле слова. Анализ документов с помощью ПК занимает в 4-10 раз меньше времени, в зависимости от объема коллекции и состава документов. В общей цене работы с документами стоимость ручного анализа и сортировки составляет в среднем около 70% (сбор и первичная обработка — 8% и 19%, соответственно). Использование предиктивного кодирования может сэкономить до 70% денежных расходов и до 80% затрат времени по этой статье.

Как это работает?

В начале эксперты создают и сами обрабатывают небольшой набор документов разной степени полезности. На основе этого набора алгоритмы, используемые программным обеспечением, "самообучаются" — программа анализирует их по доступным ей параметрам и создает математическую модель. Предиктивное кодирование — итеративным процессом: результаты первой итерации просматривает человек, указывая, какие документы и в какой степени соответствуют поставленной задаче. После этого цикл повторяется — программа вновь ищет по учебному набору, но уже вооруженная уточненными параметрами, результаты вновь проверяются и так далее, пока алгоритмы не научатся с высокой степенью точности определять нужные документы. Только после этого запускается поиск по всей коллекции документов. В некотором смысле процесс подобен поиску пресловутой иголки в стоге сена, с той разницей, что необходимо сперва как можно точнее описать для компьютера, как выглядит иголка; а компьютер уже быстро перебирает стог по соломинке.
Принципиальное отличие этой технологии от предшествующих — способность адаптироваться. Традиционная технология базируется на частотном поиске по ключевым словам, что заведомо ограничивает объем найденного и качество сортировки. Предиктивное кодирование принимает во внимание также тип документа, язык, содержание, участвующих акторов, временные рамки и т.п. Чрезвычайно важно, чтобы с программным обеспечением работали эксперты, разбирающиеся в деталях интересующего заказчика дела — качество тестового комплекта документов и "обучения" алгоритмов определяет эффективность применения технологии.

Будущее технологии и связанные с ней проблемы

В обозримом будущем будет расширяться сфера использования ПК. Поначалу технология в основном применялась в гражданских процессах, однако все чаще использует в других сферах, в первую очередь, в делах, связанных со слияниями и поглощениями.

При использовании ПК возникает и ряд вопросов юридического свойства. Когда суд требует относящиеся к делу документы, необходимо осуществить "поиск в разумных пределах" — может ли суд считать, что предиктивное кодирование удовлетворяет этим требованиям? В феврале 2012 года судья Эндрю Пек из США стал первым, кто официально признал выборку по методу предиктивного кодирования в суде (в деле Monique Da Silva Moore v. Publicis Group & MSL Group), но пока немногие следуют его примеру. По всей видимости, по мере развития технологии ее официально использование будет распространяться.

Далее, остается вечная проблема конфиденциальности. Как фирма может гарантировать тайну общения адвоката и клиента, когда документы оказываются в доступности для посторонних специалистов? Та же проблема существует и в случае традиционного анализа всех документов вручную. Пока прецедентов злоупотреблений этим инструментом нет, но очевидно, что проблема, по крайней мере потенциально, существует.

С другой стороны, апологеты технологии утверждают, что уже сейчас она более эффективна, чем ручной поиск, не только с точки зрения затрат времени и денег, но — самое главное — качества результатов. Считается, что ручной просмотр в среднем позволяет найти около 60% нужных документов, а компьютерные алгоритмы — 77%.

В деле против Dulles Jet Center, владельца рухнувших под тяжестью снега ангаров, где хранились дорогостоящие частные самолеты, необходимо было изучить 1,3 млн документов. Группа экспертов взяла образец из 5000 документов, обработала их, как описано выше, и в результате поиск по всему массиву выдал 173 000 потенциально релевантных бумаг. Затем 400 из них были проверены вручную, и оказалось, что 80% из них действительно относились к сути дела. Затем та же группа проверила часть документов, отвергнутых программой — лишь 2,9% из них могли оказаться полезными. Иными словами, программа обнаружила 81% нужных документов — это очень хороший результат по всем стандартам.

По материалам ПРАВОru

Способы связи

Ваше имя:
Ваш вопрос:
 
Rambler's Top100 HotLog
Все права защищены © А. Ю. Кожемякин, 2007-2018.
Защита и представительство по уголовным делам; представление интересов в гражданских спорах, арбитраже. Кредитные споры. Налоговые споры. Корпоративные споры. Земельные споры. Консультации. Составление документов.
Сайт kozhemjakin.ru не является средством массовой информации; автор не несет ответственности за оценочные публикации, в том числе за комментарии, оставленные третьими лицами. Сведения, опубликованные на сайте, не могут быть использованы в качестве доказательств в правовых процедурах.

Самара, Россия

Фотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография Самары
(846) 922-82-47
+7-937-072-22-29
+7-927-712-82-47

Новости

В Госдуме предложили уголовные сроки за незаконное обогащение чиновников: https://t.co/v07OZeMCPb
20/07/2019 10:42
На сайте ФПА опубликовали тест для претендентов на статус адвоката: https://t.co/Sbj7LkUGGR
20/07/2019 10:41
КС: адвоката по назначению нельзя уволить без санкции суда: https://t.co/4JSpnbYg9t
19/07/2019 16:11
ФСБ сможет отменять международные авиарейсы: https://t.co/jRdwKaemQN
19/07/2019 16:10
Президент назначил судей: https://t.co/JLLxcHNcCR
19/07/2019 16:08
ВККС ищет зампредов и судей: https://t.co/itucQA3HYB
19/07/2019 16:06
Госдума расширила основания для увольнения прокуроров: https://t.co/r95EcX1b09
18/07/2019 16:07
За неоплату проезда по платным трассам введут штрафы: https://t.co/tJAZHgBOaO
18/07/2019 16:06
Географические указания станут новым объектом интеллектуальных прав: https://t.co/aUGPysLOOq
18/07/2019 16:05
Электронные паспорта введут до 2023 года: https://t.co/vUqRvfYQAz
18/07/2019 09:46