Представьте ваши доказательства

Технология E-discovery превратила судебные тяжбы между корпорациями в бизнес, связанный с хранением и управлением данными.

Типоразмеры smd корпусов микросхем.

В 2002 году Брэд Боннингтон поступил на работу в крупную юридическую фирму под названием Fenwick&West, расположенную в Силиконовой Долине, США. В то время фирма работала над  судебным иском Compuware против IBM, который был позднее урегулирован за $400 миллионов. Компания Compuware обвинила IBM в нарушении авторских прав и несоблюдении антимонопольного законодательства. Общий объем документов по делу составлял более 120 миллионов страниц, и фирма с огромным трудом справлялась с таким количеством данных.

«Часть документов хранилась в бумажном виде, но для работы с цифровыми документами требовалось использование программного комплекса для раскрытия имеющихся по делу документов в электронной форме (e-discovery). На тот момент не существовало программ e-discovery, которые бы нас устраивали», - вспоминает Боннингтон, директор по профессиональной поддержке фирмы Fenwick. E-discovery представляет собой процесс сбора свидетельств по делу, хранящихся в электронной форме на компьютерах фирм, вовлеченных в судебный процесс, с последующей их организацией таким образом, чтобы они могли быть использованы в суде. В 2002 году методы e-discovery практически не использовались, так как на тот момент еще не существовало соответствующих технологий.

В течение последних десяти лет рынок e-discovery значительно расширился и превратился в отдельную отрасль, где существуют компании, предоставляющие услуги e-discovery, и юридические фирмы, которые включают соответствующие услуги в свое портфолио.

В связи с экспоненциальным ростом объема хранимых и генерируемых данных, эффект, оказываемый e-discovery на функционирование ЦОД будет только усиливаться.

Сбор и сортировка данных

По словам Кевина Мура, директора ИТ-департамента фирмы Fenwick, процесс e-discovery начинается со встречи адвокатов, представляющих стороны в суде, с последующим обсуждением того, как будет вестись применение технологий e-discovery в ходе судебной тяжбы. Затем, адвокаты совершают запрос на получение доступа к данным за определенный период времени. «Происходит выборка релевантных данных и назначение людей, ответственных за хранение полученных данных». Хранители – это люди, которые либо хранят собранные данные непосредственно на своих компьютерах, либо имеют к ним доступ через служебный системный аккаунт.

Fenwick предлагает своим клиентам услуги по сбору данных. «Мы приходим к клиенту и собираем все необходимые данные, которые впоследствии хранятся в выделенном специально для них месте», - говорит Мур. Затем, команда Мура размещает извлеченные данные в отдельной области сетевого хранилища фирмы для их последующей обработки.

Данные извлекаются в родных форматах: документы Microsoft Word и PDF, электронные письма. Затем они помещаются в рабочую среду программного обеспечения, которое используется в фирме. Далее, команда производит структурирование данных и снабжает их тегами для удобства работы адвокатов. Данный этап может включать в себя создание индекса ключевых слов, устранение дубликатов или выделение повторяющихся электронных писем. К примеру, команда может получить десять копий одного письма от десяти различных хранителей данных. В таком случае, все десять копий будут сохранены и помечены, как дубликаты, объясняет Мур.

В ходе выполнения анализа адвокаты снабжают документы метками, как то: «релевантно», «не релевантно», «конфиденциально» и т.д. Затем, документы направляются в суд и передаются  противоположной стороне.

Под защитой межсетевого экрана

Далеко не все юридические фирмы производят всю эту работу самостоятельно. Большая часть фирм отдает e-discovery на аутсорсинг третьим лицам, которые перекачивают извлеченные данные в свои ЦОД и подгатавливают их для последующего использования адвокатами. «В последнее время наблюдается тенденция производить обработку данных средствами юридических фирм. Еще несколько лет назад подобный подход применялся редко, если не считать Fenwick и ряд других фирм. Сегодня мы можем наблюдать, как все большее число фирм инвестирует в собственную инфраструктуру для e-discovery», - утверждает Боннингтон.

Такая ситуация объясняется целым рядом факторов, в том числе, значительной экономией бюджета фирмы в долгосрочной перспективе. Это явилось одной из причин, по которой фирма Fenwick решила вести обработку данных e-discovery своими силами. «В конечном счете, вы сэкономите кучу денег себе и своим клиентам», - говорит Боннингтон. Еще одним важным аспектом является конфиденциальность данных. Как правило, e-discovery предполагает работу с корпоративной и частной информацией, требующей особого обращения, и вполне разумно избегать хранения подобной информации в дата-центрах, принадлежащих третьим сторонам. Мэтт Берри, основатель и президент компании Lateral Data, разработчика ведущего программного продукта на рынке e-discovery под названием ViewPoint, утверждает, что для юридических фирм, имеющих собственные мощности для обработки данных e-discovery, открываются новые серьезные статьи дохода. За счет снижения цен на предоставление клиентам услуг e-discovery многие компании привлекают новых заказчиков.

В июле 2012 года компания LateralData была приобретена фирмой Xerox, которая сделала компанию частью своего подразделения по разработке продуктов для судебных процессов. Цена сделки составила $30 миллионов. Берри утверждает, что на сегодняшний день ответом на вопрос, что лучше, аутсорсинг или его отсутствие, является применение смешанного подхода. Многие фирмы предпочитают обрабатывать данные самостоятельно, прибегая к аутсорсингу только в случае выполнения особо крупных заказов.

Получение данных из облачных сервисов

Достаточно часто можно столкнуться с ситуацией, когда юридическая фирма не справляется с обработкой данных своими силами, поскольку объем обрабатываемых в ходе e-discovery данных в течение последних лет растет по экспоненте. Электронная почта, мобильные устройства и хранение данных в облаке только усугубляют ситуацию. Кевин Мур из компании Fenwick утверждает, что никогда нельзя знать заранее, какой объем дискового пространства понадобится для хранения данных по очередному судебному делу. Цифра значительно меняется от процесса к процессу. «Например, однажды, мы получили около 1ТБ данных от семи-восьми хранителей», - вспоминает Мур.

«Рост объема используемых данных все время ускоряется», - говорит Боннингтон, утверждая, что  обрабатывать данные становится с каждым днем все сложнее.

«Цены на носители падают. Люди стали дольше хранить свои электронные письма. Электронная почта существует уже довольно давно, так что если необходимые нам данные все еще хранятся на серверах, мы получаем к ним доступ. Каждый месяц мы наращиваем объем имеющегося у нас дискового пространства». После завершения судебного дела данные вовсе не обязательно будут удалены с сервером фирмы Fenwick. Все зависит от пожеланий клиента и от решения суда, но в большинстве случаев данные продолжают храниться на серверах.

На сегодняшний день, основные усилия фирмы в отношении e-discovery по-прежнему направлены на работу с электронной почтой, утверждает Боннингтон. «Люди, как правило, используют электронную почту для обмена документами».  И речь здесь идет не только о корпоративной переписке. По словам Берри, ViewPoint позволяет соединяться с облачными сервисами, например, Gmail. Компании также чаще стали хранить документы на таких площадках, как SharePoint и Google Docs, некоторые полезные данные могут быть найдены на Facebook. «Иногда нам приходится посещать Facebook», говорит Берри. Смартфоны сегодня также являются частью e-discovery, но их применение пока что довольно ограничено, по крайней мере, в Fenwick. То же касается и планшетов. «Лично мне пока не приходилось заниматься получением данных с iPad, но возможно в будущем все изменится», - утверждает Боннингтон.

Смартфоны представляют собой непростую задачу для работников отрасли e-discovery, так как они достаточно часто обновляются. Даже небольшое обновление ПО смартфона, работающего на Android, может вызвать серьезную головную боль у членов команды Боннингтона.

На пути к петабайту

Основой для инфраструктуры e-discovery в фирме Fenwick служат два SQL сервера и сеть хранения данных. В любой момент времени в работе также задействованы от 50 до 75 виртуальных машин, развернутых на двух физических серверах, которые предназначены для проведения полного цикла обработки данных, начиная от извлечения данных и заканчивая их анализом. На стороне клиента реализован интерфейс, с помощью которого адвокаты просматривают документы и снабжают их метками. Доступ к интерфейсу осуществляется на основе служб терминалов и может быть предоставлен любому необходимому количеству людей. Связь с удаленными площадками может быть организована с использованием защищенной линии.

В настоящий момент около 100Тб активного дискового пространства, используемого БД  в дата-центре фирмы Fenwick, расположенном в Mountain View, штат Калифорния, открыто для доступа через интернет. «Мы предоставляем доступ к структурированным и управляемым данным», - утверждает Боннингтон. Еще около 500-600Тб дискового пространства не являются активно используемыми в нашей БД. По его словам, фирма наращивает общий объем дискового пространства не реже, чем раз в квартал. Полная замена дискового массива производится не реже, чем раз в год. Кевин Мур заявляет, что минимальный объем дискового пространства, необходимый для использования e-discovery, приближается к 1 петабайту (1024Тб).

Инфраструктура, обеспечивающая поддержку среды e-discovery в фирме Fenwick, обособлена от остальной ИТ-инфраструктуры компании.

Тестирование нового программного продукта

Большая часть рабочего процесса e-discovery в Fenwick связана с использованием программы ViewPoint от Lateral. Фирма принимала активное участие в разработке данного продукта, стартовавшей около семи лет тому назад. Перед командой Боннингтона была поставлена задача по поиску ПО для e-discovery, которое являлось бы универсальным и не требовало бы хранения полученных данных в ЦОД третьих лиц. Это было непростой задачей, поскольку большинство поставщиков услуг e-discovery предполагают прохождение данных через принадлежащую им инфраструктуру на том или ином этапе.  

Цены на аутсорсинг в то время сильно выросли. «Передача данных по судебному процессу на аутсорсинг третьей стороне всегда обходилась крайне дорого», - вспоминает Боннингтон. «Но нам удавалось производить всю обработку своими силами». Стратегия компании предполагала использование аутсорсинга только в том случае, если фирма не справлялась с обработкой имеющегося объема данных.

Наконец, фирма узнала о существовании компании Lateral, которая возникла в 2003 году как разработчик ПО и провайдер услуг e-discovery, но довольно скоро перестала заниматься предоставлением услуг. В распоряжении Lateral находилось программное решение, которое вполне соответствовало требованиям Fenwick, и фирма начала испытывать на себе все нововведения в данном продукте. «Они очень щедро предоставляли нам все необходимые ресурсы, адвокатов для тестирования ПО, и обеспечивали рабочие условия, требуемые для доработки продукта», - говорит Берри о сотрудничестве с Fenwick. Lateral получало ежедневные отчеты от фирмы в отношении того, какие компоненты продукта работали правильно, а какие требовали модификации, так что процесс разработки для инженеров был значительно упрощен, поскольку они точно знали, каким функционалом должна обладать программа.

Применение современных технологий в ходе судебного процесса

Программа использовалась рядом фирм в тестовом режиме, начиная с 2004 года, но только в 2009 году продукт был окончательно готов к выпуску. На сегодняшний день он имеет версию 5.35. Данное решение позволяет адвокатам фирмы Fenwick просматривать порой до десятков миллионов страниц, благодаря сложным алгоритмам поиска, агрегирования данных, именования категорий и другим функциям, реализованным в программе. Еще десять лет назад о таком можно было только мечтать.

«В то время миром правили бумажные документы, но теперь все изменилось», - говорит Боннингтон. «Мы по-прежнему собираем документы на бумаге, но делаем это в минимальном объеме». Сложно сказать, повлияли ли новые технологии на справедливость судебных разбирательств. Однако, если судить по объему используемых данных, то теперь суд располагает гораздо большим количеством информации.

Теги:
#ЦОД в целом

Оставить комментарий

Ваше имя:
E-mail:
(Не обязательно)
Текст комментария:
Введите код с картинки:  

Дополнительные материалы

ПРОФЕССИОНАЛЬНОЕ обучение проектированию систем вентиляции и кондиционирования

Можно ли зимой включать кондиционер на обогрев

Вытяжка в стену: как подобрать и правильно сделать своими руками

3 способа сделать увлажнитель воздуха для квартиры и дома своими руками

Всё самое важное про турбодефлекторы: что такое, принцип работы, внешний вид, как подобрать

Вентиляция в квартире: самое полное руководство простым языком

Встраиваемая вытяжка на кухне: важные нюансы по устройству и подключению

Вытяжка в дачном туалете: как сделать правильно своими руками