SEOhit.ru - Всё о поисковых системах
Навигация
Продвижение сайтов. Теория и практика
Принцип работы поисковых систем, обзор алгоритмов
Поисковые системы: Яндекс, Рамблер, Google, Апорт и др.
Обзор софта
Ошибки, казусы, коррупция
Региональные и "экзотические" поисковые системы
Реклама в интернете
Доменные зоны
Доменное имя - теория и практика
Список регистраторов. Реселлерство
Интернет и Закон
Who is who?
Главная
Каталоги
Статьи
Форум
Веб ссылки
Полезная информация
Поиск
Партнеры
Доп. инфо
Сейчас на сайте
Гостей: 1
На сайте нет зарегистрированных пользователей

Пользователей: 18
Посетитель: nikblo
Темы форума
Новые темы
Главная поисковая си...
Про ПРные домены и п...
Поиск по большой баз...
Мощный скрипт для ге...
Обсуждаемые темы
Про ПРные домены ... [9]
Мощный скрипт для... [4]
Поиск по большой ... [3]
Главная поисковая... [0]
Последние статьи
Легкий хлеб реселлера
Что такое реселлинг?
Белая, Серая и Черна...
Site-Auditor Light
NetPromoter: новые в...
Голосование
Какую поисковую систему вы предпочитаете?

Яндекс

Rambler

Google

Yahoo

Апорт

Другую

Затрудняюсь ответить

Для участия в опросах вы должны залогиниться.
Гость
Имя

Пароль



Забыли пароль?
Запросите новый здесь.
Поддержка
Просмотр темы
SEOhit.ru - Всё о поисковых системах | Практика оптимизации | Поисковые технологии
Автор Поиск по большой базе фраз
SEO
Пользователь

Сообщений: 2
Зарегистрирован: 21.12.06
Опубликовано 21-12-2006 14:41
Есть 100М самых разнообразных фраз. Длина фразы до 10 слов, есть куча дополнительных столбцов типа integer. Нужно искать все фразы, содержащие одно, два или три слова. Иногда в запросе будет упоминаться значение одного из полей типа integer. Количество поисков будет очень большим, повторяющиеся запросы редки. Требуется максимизировать скорость выборки данных. Что посоветуете?

P.S. Пока хочу сделать так: загнать всё в Mysql и сделать доп. таблицу слово-номер_фразы. Или загнать в mysql и делать LIKE. smiley
Послать приватное сообщение
Автор RE: Поиск по большой базе фраз
Max
Пользователь

Сообщений: 2
Зарегистрирован: 21.12.06
Опубликовано 21-12-2006 14:44
SEO написал:
Есть 100М самых разнообразных фраз. Длина фразы до 10 слов, есть куча дополнительных столбцов типа integer. Нужно искать все фразы, содержащие одно, два или три слова. Иногда в запросе будет упоминаться значение одного из полей типа integer. Количество поисков будет очень большим, повторяющиеся запросы редки. Требуется максимизировать скорость выборки данных. Что посоветуете?

P.S. Пока хочу сделать так: загнать всё в Mysql и сделать доп. таблицу слово-номер_фразы. Или загнать в mysql и делать LIKE. smiley


--------------------------------------------------------------------------------

Загнать в MySQL версии не меньше 4.1.16 (не спрашивайте почему, начну ругаться матом) и построить full text индекс. На 100 мб и большом количестве ОЗУ (скажем 512 мб памяти) будет однозначно летать. Не забудьте перед постройкой индекса выставить в my.cnf параметры
ft_min_word_len=1
ft_stopword_file=
Не знаю, насколько адекватно работает full text в mysql 5.x
Послать приватное сообщение
Автор RE: Поиск по большой базе фраз
SEO
Пользователь

Сообщений: 2
Зарегистрирован: 21.12.06
Опубликовано 21-12-2006 14:48
Не знаю, насколько адекватно работает full text в mysql 5.x


У меня отъедает память на треть и кладёт mysql сервер. Mysql 5 и Freebsd 6
Послать приватное сообщение
Автор RE: Поиск по большой базе фраз
Vica
Пользователь

Сообщений: 1
Зарегистрирован: 21.12.06
Опубликовано 21-12-2006 15:00
сделать инвертированный список?
Послать приватное сообщение
Перейти на форум:
Кормушка :) :