А ведь забавная идея - ЕСМ-система с OLAP-like интерфейсом и произвольным атрибутированием объектов. И с возможностью построения иерархических множеств объектов по разрезам кубов.
Простой - не даёт. Даёт анализ статистики и поиск трендов. Тут основная идея - организовать данные, которые будут добываться (data mining) из документов образом, максимально пригодным для анализа, при этом получив возможность выборки источников данных, вписывающихся в тренд. Что наводит на мысль хранить данные ЧДА и их источники единообразно.
> Что наводит на мысль хранить данные ЧДА и их источники единообразно. а "золотое правило механики" уже отменили? парсим исходники - храним экстракт структурированно.
"документ - это не только битстрим, но и 3..4 килобуквы осмысленных данных" ;-)
no subject
Date: 2004-12-20 01:23 pm (UTC)no subject
Date: 2004-12-23 10:32 am (UTC)а "золотое правило механики" уже отменили?
парсим исходники - храним экстракт структурированно.
"документ - это не только битстрим, но и 3..4 килобуквы осмысленных данных" ;-)