dzz: Dizzy の春 (Default)
[personal profile] dzz
Отсутствие ограничений суть зло.

Коллеги создали на ZFS директорию с 50 миллионами файлов. Задачка их удаления за разумное время оказалась крайне нетривиальной. Сейчас склоняюсь к мысли слить всё остальное на другой носитель и дропнуть FS.

Занятно, но на UFS такая ситуация практически невозможна - inode-ы кончились бы намного раньше.

Date: 2011-09-04 03:46 am (UTC)
nine_k: A stream of colors expanding from brain (Default)
From: [personal profile] nine_k
Отсутствие ограничений — это свобода. При неумелом употреблении опасна, как и многое другое.

А ведь кому-то, может, актуально иметь 50 миллионов файлов :) Кстати, за какое время они их столько создали?

Date: 2011-09-04 07:46 am (UTC)
From: [identity profile] dzz.livejournal.com
Это 50 миллионов никому не нужных транзакций зибеля ;)

За год с хвостом. Коллеги просто забыли, что их нужно чистить.

Собственно, началось всё с "ой, место на диске кончилось". du замер навеки. Методом исключения нашёл эту директорию с 60 гигами крошечных файлов. Написал скрипт параллелизации удаления. Он только список файлов 4 часа зачитывает. За двое суток в 4 потока удалилось около 3 миллионов. В общем, такими темпами будет шарашить недели две.

Date: 2011-09-04 07:49 am (UTC)
nine_k: A stream of colors expanding from brain (Default)
From: [personal profile] nine_k
Ого, всё, как в настоящей базе данных, включая даже метод "переписать нужное, а остальное грохнуть" :))

А du — это они погорячились, да %)

Date: 2011-09-04 08:00 am (UTC)
From: [identity profile] dzz.livejournal.com
По масштабам бедствия похоже ;)

Date: 2011-09-04 10:57 pm (UTC)
From: [identity profile] k001.livejournal.com
Забавный use case для ZFS :)

Date: 2011-09-04 11:18 pm (UTC)
From: [identity profile] dzz.livejournal.com
Угу, причём, неожиданный - мало кому в здравом уме придёт в голову ;)

Вообще, алгоритмы fast directory drop-а были бы полезны в fs, но специальных реализаций я что-то не помню (кроме фонового удаления в UFS, эффективного для умеренного количества больших файлов, но не в этом случае).

Date: 2011-09-11 09:42 am (UTC)
From: [identity profile] dzz.livejournal.com
В итоге таки убил dataset - это заняло всего 4 часа на освобождение блоков в пуле против пары-тройки недель на unlink-и.

Надо б, наверное, про этот usecase написать разработчикам, а то мужики-то и не знают ;)))

April 2026

S M T W T F S
   1 2 34
56 7 891011
1213141516 1718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Apr. 20th, 2026 05:14 am
Powered by Dreamwidth Studios