|
|
|
| Здравствуйте. Прошу помочь.
Есть файл xls в нем 12-13 листов, на каждом из которых один столбец в несколько тысяч разных фраз/словосочетаний/предложений, и рядом с каждой фразой в соседнем втором столбце индекс/число (чем оно больше, тем фраза важнее).
Как посчитать на каком количестве листов файла встречается каждая фраза файла и ее средний индекс важности? Нужен подсчет повторяемости фраз только целиком на строгое соответствие - розовые слоны и розовые слоны с ушами это две разные фразы - повторяемость для каждой отдельно считаем.
Спасибо. | |
|
| |
|
|
|
| Всем привет!
У меня похожая задача, связанная с изучением английского. Отдельную тему пока создавать не стал. Возможно, кто-то из участников здесь подскажет подходящий форум или даст ссылку на готовую программу.
Хотелось бы в любом английском тексте подсчитывать, сколько раз встретилось то или иное незнакомое слово. Если эта программа окажется настолько умной, что сможет объединять родственные словоформы - это ещё лучше! :) | |
|
| |
|
|
|
| Можно разобрать текст на слова (части текста разделенные пробелом), запихнуть эти слова в таблицу и сделать запросом с группировкой и count, но многое зависит от исходного формата данных и размера. на больших объемах будет притормаживать. Хотя текстовые csv размеров не несколько мегабайт обрабатывались вполне шустро, то они линковались как таблица, а не парсились как текст | |
|
| |
|
|
|
| можно прилинковать каждый лист как таблицу в access потом запросм с union объединить все в одном запросе (или для ускорения обработки insert в таблицу access) и потом делать запрос с группировкой | |
|
| |
|
|
|
| как это реализовано можно посмотреть вот здесь - Количество вхождений подстроки в строку (VBA) http://am.rusimport.ru/MSAccess/topic.aspx?ID=795 | |
|
| |