Помогите понять пример использования php-ml

432
21 сентября 2017, 17:00

Пару часов пытался разобраться в примере для php-ml. Не понимаю, что имнно в этом примере происходит. Обучается сеть из csv файла формата "Текст предложения","язык" Вот сам пример

$dataset = new CsvDataset('data/languages.csv', 1);
$vectorizer = new TokenCountVectorizer(new WordTokenizer());
$tfIdfTransformer = new TfIdfTransformer();
$samples = [];
foreach ($dataset->getSamples() as $sample) {
    $samples[] = $sample[0];
}
$vectorizer->fit($samples);
$vectorizer->transform($samples);
$tfIdfTransformer->fit($samples);
$tfIdfTransformer->transform($samples);
$dataset = new ArrayDataset($samples, $dataset->getTargets());
$randomSplit = new StratifiedRandomSplit($dataset, 0.1);
$classifier = new SVC(Kernel::RBF, 10000);
$classifier->train($randomSplit->getTrainSamples(), $randomSplit->getTrainLabels());
$predictedLabels = $classifier->predict($randomSplit->getTestSamples());
echo 'Accuracy: '.Accuracy::score($randomSplit->getTestLabels(), $predictedLabels);

Не понятно, где именно происходит ввод данных на вход. Понял лишь то, что на вход подаются данные, на которых сеть и обучалась.

Как мне подать на вход свой текст и определить, насколько вероятно, что это предложение написано на английском языке?

Вот ссылка на сам пример php-ml-examples/classification/languageDetection.php

И на библиотеку https://github.com/php-ai/php-ml

READ ALSO
Найти все ссылки в тексте, исключая тег <a>

Найти все ссылки в тексте, исключая тег <a>

Добрый вечер! Есть регулярка для определения ссылок в тексте:

285
Разбить результат на тэги

Разбить результат на тэги

Подскажите, пожалуйста, как решить задачу: Есть результат в одну строку:

208
php закрытие / слэш

php закрытие / слэш

Доброго вечера как бы правильно сделать

236