Загрузка L2C - Загрузка исходного кода L2C

L2C

AI Исходный код

1.0.0

Скачать

L2C: обучение кластеризации

Стратегия кластеризации с глубокими нейронными сетями. В этой статье блога представлен общий обзор.

Введение

Этот репозиторий предоставляет реализацию PyTorch схем трансферного обучения (L2C) и два критерия обучения, полезных для глубокой кластеризации:

Вероятность метаклассификации (MCL)* — Новости: принято на ICLR2019 (заголовок: «Многоклассовая классификация без многоклассовых меток»).
Контрастная потеря на основе KLD (KCL)

_{^{*Переименовано из CCL.}}

Этот репозиторий содержит следующие ссылки:

 @inproceedings{Hsu19_MCL,
	title =	    {Multi-class classification without multi-class labels},
	author =    {Yen-Chang Hsu, Zhaoyang Lv, Joel Schlosser, Phillip Odom, Zsolt Kira},
	booktitle = {International Conference on Learning Representations (ICLR)},
	year =      {2019},
	url =       {https://openreview.net/forum?id=SJzR2iRcK7}
}

@inproceedings{Hsu18_L2C,
	title =     {Learning to cluster in order to transfer across domains and tasks},
	author =    {Yen-Chang Hsu and Zhaoyang Lv and Zsolt Kira},
	booktitle = {International Conference on Learning Representations (ICLR)},
	year =      {2018},
	url =       {https://openreview.net/forum?id=ByRWCqvT-}
}

@inproceedings{Hsu16_KCL,
	title =	    {Neural network-based clustering using pairwise constraints},
	author =    {Yen-Chang Hsu and Zsolt Kira},
	booktitle = {ICLR workshop},
	year =      {2016},
	url =       {https://arxiv.org/abs/1511.06321}
}

Подготовка

Этот репозиторий поддерживает PyTorch 1.0, Python 2.7, 3.6 и 3.7.

pip install -r requirements.txt

Демо

Контролируемая классификация/кластеризация только с парным сходством

 # A quick trial:
python demo.py  # Default Dataset:MNIST, Network:LeNet, Loss:MCL
python demo.py --loss KCL

# Lookup available options:
python demo.py -h

# For more examples:
./scripts/exp_supervised_MCL_vs_KCL.sh

Неконтролируемая кластеризация (перенос обучения между задачами)

 # Learn the Similarity Prediction Network (SPN) with Omniglot_background and then transfer to the 20 alphabets in Omniglot_evaluation.
# Default loss is MCL with an unknown number of clusters (Set a large cluster number, i.e., k=100)
# It takes about half an hour to finish.
python demo_omniglot_transfer.py

# An example of using KCL and set k=gt_#cluster
python demo_omniglot_transfer.py --loss KCL --num_cluster -1

# Lookup available options:
python demo_omniglot_transfer.py -h

# Other examples:
./scripts/exp_unsupervised_transfer_Omniglot.sh

Примечания

Результаты кластеризации сильно зависят от производительности сети прогнозирования сходства (SPN). Для справедливого сравнения имя SPN необходимо оставить прежним. Наш скрипт обучает SPN со случайной инициализацией и случайной выборкой данных. После обучения модели SPN сценарий будет повторно использовать сохраненное имя SPN и не будет обучать новый.
В таблице ниже представлена производительность кластеризации с эталонным именем SPN [загрузить]. Поместите файл модели в папку /outputs и запустите demo_omniglot_transfer.py напрямую, чтобы сгенерировать столбец «MCL(k=100)».
Метрикой производительности является точность кластеризации (подробнее см. в документе L2C). Каждое значение в таблице представляет собой среднее значение трех прогонов кластеризации. Этот репозиторий повторно использует большинство утилит PyTorch и отличается от реализации на основе Lua, используемой в справочных документах. Результат (строка с «--Average--») показывает ту же тенденцию, что и статьи, но абсолютные значения имеют небольшую разницу. Результаты MCL здесь лучше, чем в статье.

Набор данных	gt #класс	КСЛ (к=100)	МКЛ (к=100)	КСЛ (к=гт)	MCL (к=гт)
Ангельский	20	73,2%	82,2%	89,0%	91,7%
Атемайар_Келисайер	26	73,3%	89,2%	82,5%	86,0%
Атлантида	26	65,5%	83,3%	89,4%	93,5%
Аурек_Беш	26	88,4%	92,8%	91,5%	92,4%
Авеста	26	79,0%	85,8%	85,4%	86,1%
Ge_ez	26	77,1%	84,0%	85,4%	86,6%
глаголица	45	83,9%	85,3%	84,9%	87,4%
Гурмухи	45	78,8%	78,7%	77,0%	78,0%
Каннада	41	64,6%	81,1%	73,3%	81,2%
Кебл	26	91,4%	95,1%	94,7%	94,3%
малаялам	47	73,5%	75,0%	72,7%	73,0%
Манипури	40	82,8%	81,2%	85,8%	81,5%
Монгольский	30	84,7%	89,0%	88,3%	90,2%
Старая_Церковная_Славянская_Кириллица	45	89,9%	90,7%	88,7%	89,8%
Ория	46	56,5%	73,4%	63,2%	75,3%
Силхети	28	61,8%	68,2%	69,8%	80,6%
Сирийский_Серто	23	72,1%	82,0%	85,8%	89,8%
Тенгвар	25	67,7%	76,4%	82,5%	85,5%
тибетский	42	81,8%	80,2%	84,3%	81,9%
УЛОГ	26	53,3%	77,1%	73,0%	89,1%
--Средний--		75,0%	82,5%	82,4%	85,7%

Сравните MCL и KCL

Поверхность потерь MCL больше похожа на перекрестную энтропию (CE), чем на KCL. Эмпирически MCL сходилась быстрее, чем KCL. Более подробную информацию можно найти в документе ICLR.

Связанные приложения

Обнаружение полосы движения для автономного вождения / сегментация экземпляров

 @article{Hsu18_InsSeg,
	title =     {Learning to Cluster for Proposal-Free Instance Segmentation},
	author =    {Yen-Chang Hsu, Zheng Xu, Zsolt Kira, Jiawei Huang},
	booktitle = {accepted to the International Joint Conference on Neural Networks (IJCNN)},
	year =      {2018},
	url =       {https://arxiv.org/abs/1803.06459}
}

Благодарности

Эта работа была поддержана Национальным научным фондом и Национальной инициативой по робототехнике (грант № IIS-1426998), а также программой DARPA «Машины для обучения на протяжении всей жизни» (L2M) в соответствии с Соглашением о сотрудничестве HR0011-18-2-001.

Расширять

Дополнительная информация