dzz | Просто мысль...

You're viewing

dzz's journal
Create a Dreamwidth Account Learn More

Reload page in style: site light

Current Music: Saikano OST - Sayonara

А ведь забавная идея - ЕСМ-система с OLAP-like интерфейсом и произвольным атрибутированием объектов. И с возможностью построения иерархических множеств объектов по разрезам кубов.

Flat | Top-Level Comments Only

From:

dzz.livejournal.com

Простой - не даёт. Даёт анализ статистики и поиск трендов. Тут основная идея - организовать данные, которые будут добываться (data mining) из документов образом, максимально пригодным для анализа, при этом получив возможность выборки источников данных, вписывающихся в тренд. Что наводит на мысль хранить данные ЧДА и их источники единообразно.

From:

jno2004.livejournal.com

> Что наводит на мысль хранить данные ЧДА и их источники единообразно.
а "золотое правило механики" уже отменили?
парсим исходники - храним экстракт структурированно.

"документ - это не только битстрим, но и 3..4 килобуквы осмысленных данных" ;-)