Rambler's Top100
Форум: MS ACCESSБолталкаVBVBA MS OfficeMS SQL server
Новые сообщения: 01000

Форум: MS ACCESS

Вопросы связанные с MS ACCESS

Обновить визитку
Участники «Online»
Все участники

 
 

Доброго времени суток, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Посчитать повторяемость фраз
 
 автор: menedzher375@ya.ru   (19.01.2019 в 00:45)   личное сообщение
 
 

Здравствуйте. Прошу помочь.
Есть файл xls в нем 12-13 листов, на каждом из которых один столбец в несколько тысяч разных фраз/словосочетаний/предложений, и рядом с каждой фразой в соседнем втором столбце индекс/число (чем оно больше, тем фраза важнее).
Как посчитать на каком количестве листов файла встречается каждая фраза файла и ее средний индекс важности? Нужен подсчет повторяемости фраз только целиком на строгое соответствие - розовые слоны и розовые слоны с ушами это две разные фразы - повторяемость для каждой отдельно считаем.
Спасибо.

  Ответить  
 
 автор: ~1~   (21.01.2019 в 22:47)   личное сообщение
 
 

Всем привет!
У меня похожая задача, связанная с изучением английского. Отдельную тему пока создавать не стал. Возможно, кто-то из участников здесь подскажет подходящий форум или даст ссылку на готовую программу.

Хотелось бы в любом английском тексте подсчитывать, сколько раз встретилось то или иное незнакомое слово. Если эта программа окажется настолько умной, что сможет объединять родственные словоформы - это ещё лучше! :)

  Ответить  
 
 автор: osmor   (23.01.2019 в 21:13)   личное сообщение
 
 

Можно разобрать текст на слова (части текста разделенные пробелом), запихнуть эти слова в таблицу и сделать запросом с группировкой и count, но многое зависит от исходного формата данных и размера. на больших объемах будет притормаживать. Хотя текстовые csv размеров не несколько мегабайт обрабатывались вполне шустро, то они линковались как таблица, а не парсились как текст

  Ответить  
 
 автор: osmor   (23.01.2019 в 21:16)   личное сообщение
 
 

можно прилинковать каждый лист как таблицу в access потом запросм с union объединить все в одном запросе (или для ускорения обработки insert в таблицу access) и потом делать запрос с группировкой

  Ответить  
HiProg.com - Технологии программирования
Rambler's Top100 TopList