原文:
towardsdatascience.com/top-5-geospatial-data-apis-for-advanced-analysis-79349605c86d
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8f77c7bff0dc1c4b9e519795f27f899e.png
Kyle Glenn 在 Unsplash(来源:unsplash.com/es/@kylejglenn)
地理数据在许多分析中都很重要,它使我们能够根据位置和空间模式做出决策。地理数据可以派上用场的项目示例包括预测房价、交通路线优化或为企业制定营销策略。
然而,作为一名数据科学家,您将经常面临挑战,即从哪里获取这些数据。在许多情况下,存在提供地理数据信息的公共来源;然而,在许多情况下,他们提供的信息需要修改,以便我们进行所需的分析。
本文将评估五个最有用的 API,用于获取大规模地理数据。我们将评估它们的用法、优缺点以及它们提供信息的主要应用。将本文视为这些 API 使用和应用的基础,以便您可以稍后深入了解它们提供的所有工具。
1. Overpass
Overpass API 允许访问 OpenStreetMap 网站上的信息。OpenStreetMap 是一个开放的地理数据库,包含广泛的地理空间数据,从地下路线信息到道路、山脉或河流的位置信息。
OpenStreetMap 中可用的数据是开放的,并由全球用户维护,因此,数据的完整性水平在很大程度上取决于地区,因为有些地区我们可以找到更多活跃的用户,因此该平台有更多数据。然而,在大多数情况下,完整性程度很高,使我们能够为我们的地理分析收集大量信息。
Overpass API 使用一种称为 Overpass QL 的语言来设计查询,以访问 OpenStreetMap 上可用的数据。这种高度可定制的语言使我们能够创建特定的查询,仅从平台上访问分析中感兴趣的信息。
优点
完全免费:因为 OpenStreetMap 是一个开放数据库,因此 API 的使用也是完全免费的。
灵活的查询:可以使用 Overpass QL 语言高度定制查询,以仅访问感兴趣的信息。查询中还可以定制其他方面,例如数据输出格式。此外,通过查询,您可以轻松过滤想要获取的地理数据以及这些数据的搜索区域。
全球数据:OpenStreetMap 包含全球数据,因此,通过 API 可访问的信息并不局限于特定区域。
缺点
返回 API 数据的质量:如前所述,OpenStreetMap 平台是一个由志愿者维护的开放网站。因此,数据质量取决于用户,这可能导致某些用户活动低下的地区数据不完整。
查询构建所需的学习:Overpass API 中的查询使用一种称为 Overpass QL 的语言进行,当不熟悉该语言时,学习过程可能一开始特别缓慢。
后处理需求:API 返回的数据,无论是 CSV 格式还是 JSON 格式,都包含了地理元素的坐标,但并不提供我们可以直接用于分析的已处理多边形或多多边形。因此,我们需要将原始数据转换为获取不同的多边形。++
许可证
OpenStreetMap 数据可用于任何目的,包括商业用途,其使用受我们分发许可证 ODbL 的约束。
常见问题解答
用例 – 在库克斯哈文检索公交车站
以下示例展示了我们如何使用 Overpass API 获取位于库克斯哈文的所有公交车站。库克斯哈文是德国北部的一个小镇,位于北海沿岸。
以下代码显示了查询和用于通过 API 访问信息的端点。查询指定了搜索区域(Cuxhaven)、要搜索的元素类型(bus_stop)以及输出格式(json)。
get_overpass_data函数是一个通用函数,可以与任何查询一起使用,以从 Overpass API 获取响应。