Нейронные сети и машинное обучение

Регистрация
06.11.2019
Сообщения
632
Репутация
0
Баллы
0
Лайки
481
Пол
женский
Осмелюсь встрять. Тут ведь дело ещё и в том, как современные исследователи толкуют эти источники. Иногда такое припишут,что и сами авторы были бы, мягко говоря, не слабо удивлены. Что-то похожее было по литературе в школе. Начиналось примерно так - этим и этим автор хотел показать то-то и то-то... Хорошо хоть автор отошёл уже в мир иной и так и не узнает - что же он хотел показать в своём фолианте.
Понимаете, Источники может читать каждый и без посторонних комментов, но понимание Источника, как и получение информации из него, у каждого будет свое и оно напрямую зависит от степени внутренней готовности и уровня сознания.
 

Dev

Форум
Регистрация
09.02.2017
Сообщения
6 232
Репутация
114
Баллы
0
Лайки
4720
Пол
мужской
Проблема в том, что вы применяете sentiment classification к задаче, для которого этот алгоритм не предназначен.
Я с удовольствием посмотрю на ваш алгоритм и методы решения данной задачи.
Я думаю мы даже можем найти похожий пример данных на kaggle.com и протестировать оба алгоритма... Ваш и мой.
 
Регистрация
11.05.2018
Сообщения
148
Репутация
5
Баллы
0
Адрес
RSM, CA
Лайки
295
Пол
мужской
Я с удовольствием посмотрю на ваш алгоритм и методы решения данной задачи.
Я думаю мы даже можем найти похожий пример данных на kaggle.com и протестировать оба алгоритма... Ваш и мой.
Что это еще за детсад?
 
Регистрация
11.05.2018
Сообщения
148
Репутация
5
Баллы
0
Адрес
RSM, CA
Лайки
295
Пол
мужской
Какой дедсад? Вы о чем?
Тестировать и сравнивать хоть что-то в предложенной песочнице. Она хороша разве что для POC (prove of concept), и то для самых элементарных.

Эти подходы несравнимы, потому что ваш алгоритм не определяет новые категории автоматически. Но то, что описАл я, будет работать на порядок или даже на порядки быстрее. Вам при каждой новой категории придется переобучать вторую НС и переконфигурировать LSTM. И ваш алгоритм не позволяет генерировать иерархию классификаций (тип -> подтип и т.д.).

Другими словами, ваш алгоритм более-менее будет рабочим для нескольких типов документов, максимум нескольких десятков. Далее всё развалится из-за практически непреодолимого усложнения переобучения НС.
Что вы собираетесь сравнивать? Детские задачки с 20-ю категориями? Для справки: приложения и алгоритмы Big Data предназначены и тестируются именно что на огромных объемах данных. Вместе со стресс-тестами типа сотен и тысяч разных классов документов/текстов.

Ваш подход - всё равно что применять тензорное исчисление для складывания двух чисел. Впрочем, я это уже говорил.

Насколько я понимаю, у вас нет вообще никакого опыта в Big Data? Ну, судя по таким предложениям сравнивать что-то в Jupiter Notebook. :)
 

Dev

Форум
Регистрация
09.02.2017
Сообщения
6 232
Репутация
114
Баллы
0
Лайки
4720
Пол
мужской
Эти подходы несравнимы, потому что ваш алгоритм не определяет новые категории автоматически.
Я и не ставил перед собой подобную задачу.

Ваш подход - всё равно что применять тензорное исчисление для складывания двух чисел. Впрочем, я это уже говорил.

Насколько я понимаю, у вас нет вообще никакого опыта в Big Data? Ну, судя по таким предложениям сравнивать что-то в Jupiter Notebook. :)
Я так понимаю, художника может критиковать каждый, а вот написать картину нет.
Мы можем много говорить об абстрактных методах К-средних. О моем опыте, о песочницах, детском саде и прочей мути не относящейся к теме и к задаче. Но от вас мы так ничего и не увидели кроме красивых слов. Я же могу предоставить готовую модель и даже не стесняюсь ее прогнать на тестовых данных.
 
Регистрация
11.05.2018
Сообщения
148
Репутация
5
Баллы
0
Адрес
RSM, CA
Лайки
295
Пол
мужской
Я же могу предоставить готовую модель и даже не стесняюсь ее прогнать на тестовых данных.
Успехов в создании подобных моделей!

В чём соглашусь - зря я сюда влез.
 
Сверху Снизу