Remote Data Access

原文:http://pandas.pydata.org/pandas-docs/stable/remote_data.html

译者:飞龙 UsyiyiCN

校对:(虚位以待)

DataReader

删除子包pandas.io.data以支持可单独安装的pandas-datareader包这将允许数据模块独立更新到您的pandas安装。pandas-datareader v0.1.1的API与pandas v0 .16.1GH8961

您应该替换以下的导入:

from pandas.io import data, wb

使用:

from pandas_datareader import data, wb

Google Analytics

ga模块为Google Analytics API提供了一个包装,以简化检索流量数据。结果集将解析为具有从源表派生的形状和数据类型的pandas DataFrame。

Configuring Access to Google Analytics

您需要做的第一件事是设置对Google Analytics(分析)API的访问。请按照以下步骤操作:

  1. Google Developers Console
    1. 启用Google Analytics(分析)API
    2. 创建一个新项目
    3. 为“已安装的应用程序”创建一个新的客户端ID(在新创建的项目的“APIs&auth / Credentials部分”中)
    4. 下载它(JSON文件)
  2. 在您的机器上
    1. 将其重命名为client_secrets.json
    2. 将其移动到pandas/io模块目录

第一次使用read_ga()函数时,将打开一个浏览器窗口,要求您对Google API进行身份验证。请继续。

Using the Google Analytics API

以下内容将从特定媒体资源获取2014年第一季度每周的每日用户和浏览量(指标)数据。

import pandas.io.ga as ga
ga.read_ga(
    account_id  = "2360420",
    profile_id  = "19462946",
    property_id = "UA-2360420-5",
    metrics     = ['users', 'pageviews'],
    dimensions  = ['dayOfWeek'],
    start_date  = "2014-01-01",
    end_date    = "2014-08-01",
    index_col   = 0,
    filters     = "pagePath=~aboutus;ga:country==France",
)

唯一的强制参数是metrics, dimensionsstart_date我们强烈建议您始终指定account_idprofile_idproperty_id,以避免在Google Analytics(分析)中访问错误的数据桶。

index_col参数指示必须将哪个维度用作索引。

filters参数指示要应用于查询的过滤。在上面的示例中,网页网址必须包含aboutus,访问者国家必须是法国。

详细信息如下: