// qint64 - номер документа, CDocument* - сам документ, использую хеш так как нужно быстро находить нужные документы.
QHash<qint64, CDocument*> m_hashDoc;
Документов может быть огромное количество.Я умею определить, похож один документ на другой или нет:
bool isEqual( CDocument *p1, CDocument *p2);
Нужно, оптимально быстро разбить документы на категории, в каждой категории должны быть только похожие друг на друга документы.