Конференция Arenadata
Новое время — новый Greenplum
Мы приглашаем вас принять участие в конференции, посвященной будущему Open-Source Greenplum 19 сентября в 18:00:00 UTC +3. Встреча будет проходить в гибридном формате — и офлайн, и онлайн. Онлайн-трансляция будет доступна для всех желающих.
Внезапное закрытие Greenplum его владельцем — компанией Broadcom - стало неприятным сюрпризом для всех, кто использует или планирует начать использовать решения на базе этой технологии. Многие ожидают выхода стабильной версии Greenplum 7 и надеются на её дальнейшее активное развитие.
Arenadata не могла допустить, чтобы разрабатываемый годами Open-Source проект Greenplum прекратил своё существование, поэтому 19 сентября мы представим наш ответ на данное решение Broadcom, а участники сообщества получат исчерпывающие разъяснения на все вопросы о дальнейшей судьбе этой технологии.

На конференции вас ждёт обсуждение следующих тем:

  • План возрождения Greenplum;
  • Дорожная карта;
  • Экспертное обсуждение и консультации.
Осталось до события

Solr overview

Solr is a search server, and it deals with large sets of data. Since Solr can also store data, it is a NoSQL, Non-Relational storage, and a processing technology.

When you submit a query to the Solr search server, it separates queries into different pieces/entities, then matches the query against the document’s inverted index that was created earlier. The Solr search server returns a set of documents as a response based on the similarity in class or other characteristics defined in the schema.xml and solr.config files.

Solr follows a three-step process of indexing, querying, and ranking.

Indexing

There are various methods using which Solr indexes documents and other rich text-based data. Solr allows users to directly upload their documents in PDF, CSV, XML formats, and the system can read and index data from these sources automatically. Further, it can also upload texts and documents from email and attachments.

Solr uses an inverted index to store data where it uses keyword-centric rather than page-centric data structure; a simpler way to understand the concept is how words are indexed at the end of any book where the word on the page is mentioned along with its meaning. Hence, it can achieve a faster response time and gives relevant search results in no time.

Querying

A query can be anything like searching for text, images, or geolocation. When a query is sent, Solr processes it with a query handler which returns the document from the Solr index.

Ranking the results

As the system is matching the query with the data from the indexed files based on keywords, it ranks the results based on the relevance. This process creates a hierarchy of results based on relevance.

Found a mistake? Seleсt text and press Ctrl+Enter to report it