Решать юридически, а не оружием.
Марк Туллий Цицерон
Русский   English
адвокат
КОЖЕМЯКИН АНДРЕЙ ЮРЬЕВИЧ

  • Будущее юридической профессии: как работает предиктивное кодирование

27 июл, 2013

Что это за технология и зачем она нужна?

В общем виде предиктивное кодирование (ПК) — это процесс изучения документов с помощью вычислительной техники. В процессе используются алгоритмы идентификации, анализа, сортировки и приоритизации документов, результатом является организованный набор документов, интересующих пользователя, сформированный и отсортированный в соответствии с заданными им параметрами.

Эта технология позволяет значительно ускорить и удешевить анализ больших объемов данных; особенно она полезна для сложных гражданских делах. Однако на сегодняшний день эта технология пока не может полностью заменить человека.

Кому и какую пользу она приносит?

Участникам процесса — тем, кто заказывает юридические услуги, и тем, кто их предоставляет. Во-первых, в сложных делах каждый день, прошедший до принятия судом решения по делу, может дорого стоить как истцу, так и ответчику, в прямом и переносном смысле слова. Анализ документов с помощью ПК занимает в 4-10 раз меньше времени, в зависимости от объема коллекции и состава документов. В общей цене работы с документами стоимость ручного анализа и сортировки составляет в среднем около 70% (сбор и первичная обработка — 8% и 19%, соответственно). Использование предиктивного кодирования может сэкономить до 70% денежных расходов и до 80% затрат времени по этой статье.

Как это работает?

В начале эксперты создают и сами обрабатывают небольшой набор документов разной степени полезности. На основе этого набора алгоритмы, используемые программным обеспечением, "самообучаются" — программа анализирует их по доступным ей параметрам и создает математическую модель. Предиктивное кодирование — итеративным процессом: результаты первой итерации просматривает человек, указывая, какие документы и в какой степени соответствуют поставленной задаче. После этого цикл повторяется — программа вновь ищет по учебному набору, но уже вооруженная уточненными параметрами, результаты вновь проверяются и так далее, пока алгоритмы не научатся с высокой степенью точности определять нужные документы. Только после этого запускается поиск по всей коллекции документов. В некотором смысле процесс подобен поиску пресловутой иголки в стоге сена, с той разницей, что необходимо сперва как можно точнее описать для компьютера, как выглядит иголка; а компьютер уже быстро перебирает стог по соломинке.
Принципиальное отличие этой технологии от предшествующих — способность адаптироваться. Традиционная технология базируется на частотном поиске по ключевым словам, что заведомо ограничивает объем найденного и качество сортировки. Предиктивное кодирование принимает во внимание также тип документа, язык, содержание, участвующих акторов, временные рамки и т.п. Чрезвычайно важно, чтобы с программным обеспечением работали эксперты, разбирающиеся в деталях интересующего заказчика дела — качество тестового комплекта документов и "обучения" алгоритмов определяет эффективность применения технологии.

Будущее технологии и связанные с ней проблемы

В обозримом будущем будет расширяться сфера использования ПК. Поначалу технология в основном применялась в гражданских процессах, однако все чаще использует в других сферах, в первую очередь, в делах, связанных со слияниями и поглощениями.

При использовании ПК возникает и ряд вопросов юридического свойства. Когда суд требует относящиеся к делу документы, необходимо осуществить "поиск в разумных пределах" — может ли суд считать, что предиктивное кодирование удовлетворяет этим требованиям? В феврале 2012 года судья Эндрю Пек из США стал первым, кто официально признал выборку по методу предиктивного кодирования в суде (в деле Monique Da Silva Moore v. Publicis Group & MSL Group), но пока немногие следуют его примеру. По всей видимости, по мере развития технологии ее официально использование будет распространяться.

Далее, остается вечная проблема конфиденциальности. Как фирма может гарантировать тайну общения адвоката и клиента, когда документы оказываются в доступности для посторонних специалистов? Та же проблема существует и в случае традиционного анализа всех документов вручную. Пока прецедентов злоупотреблений этим инструментом нет, но очевидно, что проблема, по крайней мере потенциально, существует.

С другой стороны, апологеты технологии утверждают, что уже сейчас она более эффективна, чем ручной поиск, не только с точки зрения затрат времени и денег, но — самое главное — качества результатов. Считается, что ручной просмотр в среднем позволяет найти около 60% нужных документов, а компьютерные алгоритмы — 77%.

В деле против Dulles Jet Center, владельца рухнувших под тяжестью снега ангаров, где хранились дорогостоящие частные самолеты, необходимо было изучить 1,3 млн документов. Группа экспертов взяла образец из 5000 документов, обработала их, как описано выше, и в результате поиск по всему массиву выдал 173 000 потенциально релевантных бумаг. Затем 400 из них были проверены вручную, и оказалось, что 80% из них действительно относились к сути дела. Затем та же группа проверила часть документов, отвергнутых программой — лишь 2,9% из них могли оказаться полезными. Иными словами, программа обнаружила 81% нужных документов — это очень хороший результат по всем стандартам.

По материалам ПРАВОru

Способы связи

Ваше имя:
Ваш вопрос:
 
Rambler's Top100 HotLog
Все права защищены © А. Ю. Кожемякин, 2007-2020.
Защита и представительство по уголовным делам; представление интересов в гражданских спорах, арбитраже. Кредитные споры. Налоговые споры. Корпоративные споры. Земельные споры. Консультации. Составление документов.
Сайт kozhemjakin.ru не является средством массовой информации; автор не несет ответственности за оценочные публикации, в том числе за комментарии, оставленные третьими лицами. Сведения, опубликованные на сайте, не могут быть использованы в качестве доказательств в правовых процедурах.

Самара, Россия

Фотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография СамарыФотография Самары
(846) 922-82-47
+7-937-072-22-29
+7-927-712-82-47

Новости

В Таиланде туристу грозит два года тюрьмы за негативный отзыв об отеле: https://t.co/GAxLisxcoM
29/09/2020 12:15
Осуждённые получили право перевода в колонию по месту жительства: https://t.co/r1PoVN78ed
29/09/2020 12:07
В России некоторые аварии перестанут считаться ДТП: https://t.co/bTsYqgTGQa
28/09/2020 19:07
Кабмин освободил IT-компании от репатриации валютной выручки: https://t.co/zqcxCdcAby
28/09/2020 19:07
В правительстве не поддержали законопроект о «вынужденных безработных»; https://t.co/bNCiL1M8Yz
28/09/2020 19:06
С 1 апреля водителей освободят от сдачи площадки для получения прав: https://t.co/57o8UKPpYd
28/09/2020 19:05
Мишустин подписал постановление о новых правилах проведения ТО: https://t.co/NGPELszO0c
26/09/2020 20:15
Роспотребнадзор рекомендовал избегать излишних поездок: https://t.co/TJ9mXVJh7j
26/09/2020 19:12
Вакцинация от гриппа может стать обязательной для госслужащих и полиции: https://t.co/9mYqfLrpJF
25/09/2020 22:21
Правительство одобрило проект о МРОТ и прожиточном минимуме: https://t.co/KWC7808g3r
25/09/2020 22:20