Предобученные модели

  • doc_trans_full1-9-4
    • 3xLSTM + 2xTransformer + 3xTransformer;

    • Training data - SimEnWiki,SimRuWiki,ParalWiki,SimEnSci;

    • 2xA100, 240k updates

Также модели можно скачать по ссылке.

Благодарности

Обучение моделей выполнялось с использованием инфраструктуры Центра коллективного пользования «Высокопроизводительные вычисления и большие данные» (ЦКП «Информатика») ФИЦ ИУ РАН (г. Москва).

Предыдущие версии модели

  • doc_trans_full1-2, ts версия
    • 3xLSTM + 2xTransformer + 3xTransformer;

    • Training data - SimEnWiki,SimRuWiki,ParalWiki;

    • 2xA100, 80k updates

  • doc_trans_full1-8-4
    • 3xLSTM + 2xTransformer + 3xTransformer;

    • Training data - SimEnWiki,SimRuWiki,ParalWiki,SimEnSci;

    • 2xA100, 240k updates