gryu
дикий гусь | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Коллеги. Помогите решить задачку. Есть ряд текстовых файлов с нестандартным расширением. Файлы представляют собой "таблицу" в 6/8 колонок. Во всех колонках цифры. Разделители колонок табуляции. Имеют вид 111.111.111.111 222.222.222.222 22 333 333 12.12.2010 10:23:34 333.333.333.333 111.111.111.111 33 444 222 12.12.2010 10:23:40 .... Нужно отсортировать все записи в этих файлах по первой колонке с учётом последней (дата/время) и создать ряд других файлов с названиями "111.111.111.111" "333.333.333.333" и т.д. содержащие только записи относящиеся к 111.111.111.111, 333.333.333.333 и т.д., соответственно. В этих файлах все записи должны быть сортированы по последней колонке (дата/время) В конце каждого файла, отдельной строкой, должна быть сумма чисел 5-й колонки. Собственно желательно что бы была возможность пошаговой обработки с выбором колонки. 1. из массива файлов создаётся другой массив "111.111.111.111" "333.333.333.333" и т.д. с сортировкой по времени. Возможен, из-за обьёма желателен, вариант с "111.111.111.111-1", "111.111.111.111-2", "111.111.111.111-3" и т.д. 2. Подсчёт результирующей суммы 5-й колонки. Короче лог трафика нужно пролопатить. Штатных программ я не нашёл, чтоб понимали этот формат. P.S. Учитывая обьём данных в файлах, путь "создаём один файл и потом его дербаним" не прокатывает. Любая винда нахрен виснет. Я пробовал. Там действительно большие обьёмы. Собственно в этом не малая часть проблемы. Очень уж "тяжёлая" задача получается. ОС вешается или "уходит в себя" очень надолго. Под *NIX скрипты на перл есть. Нужно ещё под Windows. | Всего записей: 13035 | Зарегистр. 15-03-2006 | Отправлено: 12:56 18-08-2010 | Исправлено: gryu, 12:57 18-08-2010 |
|