Thursday, July 14, 2011

Interested in machine translation between Russian and English?

Then mark August 15-19 2011 in your calendars. Web of Data'11 has accepted my poster on machine translation with semantic features, the full paper title is:

Semantic Feature Machine Translation System for Information Retrieval

Some details on the work from another poster, accepted to ICSOFT'11 can be checked here:

Sunday, July 10, 2011

Пример кода, интегрирующего AOT морфологический лемматайзер в C#

АОТ предлагает свой лемматайзер для русского и английского языка на сайте www.aot.ru. Если Вам нужно интегрировать их COM внутри проекта на C#, читайте ниже.

После установки библиотеки при помощи Setup.exe, загрузите Lemmatizer.dll в C# проект. Скопируйте следующий метод или его тело, например, в main-class:

  1. private static void initAOTMorphoanalyzer()  
  2. {  
  3.  LEMMATIZERLib.ILemmatizer lemmatizerRu = new LEMMATIZERLib.LemmatizerRussian();  
  4.  lemmatizerRu.LoadDictionariesRegistry();  
  5.  LEMMATIZERLib.IParadigmCollection piParadigmCollection = lemmatizerRu.CreateParadigmCollectionFromForm("мыла", 0, 0);  
  6.   
  7.  Console.Out.WriteLine(piParadigmCollection.Count);         
  8.   
  9.     for (int j=0; j < piParadigmCollection.Count; j++)  
  10.     {  
  11.      object[] args = { j };       
  12.   
  13.      Type paradigmCollectionType = piParadigmCollection.GetType();  
  14.   
  15.      if (paradigmCollectionType != null)  
  16.      {  
  17.       object Item = paradigmCollectionType.InvokeMember("Item", BindingFlags.GetProperty, null, piParadigmCollection, args);  
  18.       Type itemType = Item.GetType();  
  19.       if (itemType != null)  
  20.       {  
  21.        object Norm = itemType.InvokeMember("Norm", BindingFlags.GetProperty, null, Item, null);  
  22.        Console.Out.WriteLine(Norm);  
  23.       }  
  24.       else  
  25.        Console.Out.WriteLine("itemType is null");  
  26.      }  
  27.      else  
  28.       Console.Out.WriteLine("paradigmCollectionType is null");  
  29.     }  
  30. }  


Результат:
2
МЫЛО
МЫТЬ

COM test example for C#: AOT lemmatizer

I will post this both in English and Russian for more people's benefit.

There is a Russian / English lemmatizer from AOT (www.aot.ru). If you need to use the COM that AOT provides inside C#, read on. Load the lemmatizer.dll inside your C# project. Insert the following method or its body inside your code, for example main class:

  1. private static void initAOTMorphoanalyzer()  
  2. {  
  3.  LEMMATIZERLib.ILemmatizer lemmatizerRu = new LEMMATIZERLib.LemmatizerRussian();  
  4.  lemmatizerRu.LoadDictionariesRegistry();  
  5.  LEMMATIZERLib.IParadigmCollection piParadigmCollection = lemmatizerRu.CreateParadigmCollectionFromForm("мыла", 0, 0);  
  6.   
  7.  Console.Out.WriteLine(piParadigmCollection.Count);         
  8.   
  9.     for (int j=0; j < piParadigmCollection.Count; j++)  
  10.     {  
  11.      object[] args = { j };       
  12.   
  13.      Type paradigmCollectionType = piParadigmCollection.GetType();  
  14.   
  15.      if (paradigmCollectionType != null)  
  16.      {  
  17.       object Item = paradigmCollectionType.InvokeMember("Item", BindingFlags.GetProperty, null, piParadigmCollection, args);  
  18.       Type itemType = Item.GetType();  
  19.       if (itemType != null)  
  20.       {  
  21.        object Norm = itemType.InvokeMember("Norm", BindingFlags.GetProperty, null, Item, null);  
  22.        Console.Out.WriteLine(Norm);  
  23.       }  
  24.       else  
  25.        Console.Out.WriteLine("itemType is null");  
  26.      }  
  27.      else  
  28.       Console.Out.WriteLine("paradigmCollectionType is null");  
  29.     }  
  30. }  


Output:
2
МЫЛО
МЫТЬ