我知道可搜索字段的Azure搜索索引会为每个分析的术语创建倒排索引,但无法在留档中找到是否存储了每个术语的术语频率。
Azure搜索是否在某处存储可搜索字段的术语频率?当只需要计算一次时,为每个搜索查询计算它似乎效率低下。
如果是这样,是否可以提取/下载整个数据集的术语频率以进行单独的处理步骤?
我们确实维护了术语频率来快速计算TF/IDF之类的东西。不幸的是,目前还没有办法从Azure搜索中获得它。