Пару часов пытался разобраться в примере для php-ml. Не понимаю, что имнно в этом примере происходит.
Обучается сеть из csv файла формата "Текст предложения","язык"
Вот сам пример
$dataset = new CsvDataset('data/languages.csv', 1);
$vectorizer = new TokenCountVectorizer(new WordTokenizer());
$tfIdfTransformer = new TfIdfTransformer();
$samples = [];
foreach ($dataset->getSamples() as $sample) {
$samples[] = $sample[0];
}
$vectorizer->fit($samples);
$vectorizer->transform($samples);
$tfIdfTransformer->fit($samples);
$tfIdfTransformer->transform($samples);
$dataset = new ArrayDataset($samples, $dataset->getTargets());
$randomSplit = new StratifiedRandomSplit($dataset, 0.1);
$classifier = new SVC(Kernel::RBF, 10000);
$classifier->train($randomSplit->getTrainSamples(), $randomSplit->getTrainLabels());
$predictedLabels = $classifier->predict($randomSplit->getTestSamples());
echo 'Accuracy: '.Accuracy::score($randomSplit->getTestLabels(), $predictedLabels);
Не понятно, где именно происходит ввод данных на вход. Понял лишь то, что на вход подаются данные, на которых сеть и обучалась.
Как мне подать на вход свой текст и определить, насколько вероятно, что это предложение написано на английском языке?
Вот ссылка на сам пример php-ml-examples/classification/languageDetection.php
И на библиотеку https://github.com/php-ai/php-ml
Айфон мало держит заряд, разбираемся с проблемой вместе с AppLab
Перевод документов на английский язык: Важность и ключевые аспекты
Добрый вечер! Есть регулярка для определения ссылок в тексте:
Подскажите, пожалуйста, как решить задачу: Есть результат в одну строку: