Работа с pdf и doc файлами C++ или C# 700 р.
Есть 1000 pdf или doc файлов. Допустим 1000. Неважно.
Есть список слов(слова задаю я; слова русские)
Количество этих слов - n. Тоже лучше сделать так, чтобы я задавал сам количество.
Нужно брать каждый файл и проверять их на наличие данных слов.
Пусть первое слово встретилось k раз.
Тогда записываем в первый вектор длины n(в первое значение) k/L, где L - количество слов в первом файле.
И так далее для каждого слова и файла.
На выходе должны получиться 1000 векторов длины n.
Если в этой папке необходимых файлов встречается pdf-файл, который не был конвертирован из doc, а был отсканен, тогда просто его не учитываем.
И вместо 1000 векторов, получаем на выходе 999.
Программа нужна консольная. Запускаешь, и действуешь дальше только через консоль.
Зарегистрируйтесь или войдите на сайт под своим именем.