对于新项目,我们建议您使用新的 Kinesis Data Analytics 工作室,而不是 SQL 应用程序的 Kinesis Data Analytics。Kinesis Data Analytics Studio 将易用性与高级分析功能相结合,使您能够在几分钟内构建复杂的流处理应用程序。
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
步骤 2:创建分析应用程序
在本节中,您将创建 AAmazon Kinesis Data Analytics 应用程序并将其配置为使用您创建的 Kinesis 数据流作为中的流媒体源步骤 1:准备数据。然后,运行使用 RANDOM_CUT_FOREST_WITH_EXPLANATION 函数的应用程序代码。
创建应用程序
打开 Kinesis 控制台,网址为:https://console.aws.amazon.com/kinesis
。 -
在导航窗格中选择 Data Analytics (数据分析),然后选择创建应用程序。
-
提供应用程序名称和描述 (可选),并选择 Create application。
-
选择 “Connect 流数据”,然后ExampleInputStream从列表中选择。
-
选择 Discover schema,并确保
Systolic和Diastolic显示为INTEGER列。如果二者为另一种类型,则选择 Edit schema,并将INTEGER类型分配给二者。 -
在 Real time analytics 下,选择 Go to SQL editor。出现提示时,选择运行您的应用程序。
-
将以下代码粘贴到 SQL 编辑器中,然后选择 Save and run SQL。
--Creates a temporary stream. CREATE OR REPLACE STREAM "TEMP_STREAM" ( "Systolic" INTEGER, "Diastolic" INTEGER, "BloodPressureLevel" varchar(20), "ANOMALY_SCORE" DOUBLE, "ANOMALY_EXPLANATION" varchar(512)); --Creates another stream for application output. CREATE OR REPLACE STREAM "DESTINATION_SQL_STREAM" ( "Systolic" INTEGER, "Diastolic" INTEGER, "BloodPressureLevel" varchar(20), "ANOMALY_SCORE" DOUBLE, "ANOMALY_EXPLANATION" varchar(512)); -- Compute an anomaly score with explanation for each record in the input stream -- using RANDOM_CUT_FOREST_WITH_EXPLANATION CREATE OR REPLACE PUMP "STREAM_PUMP" AS INSERT INTO "TEMP_STREAM" SELECT STREAM "Systolic", "Diastolic", "BloodPressureLevel", ANOMALY_SCORE, ANOMALY_EXPLANATION FROM TABLE(RANDOM_CUT_FOREST_WITH_EXPLANATION( CURSOR(SELECT STREAM * FROM "SOURCE_SQL_STREAM_001"), 100, 256, 100000, 1, true)); -- Sort records by descending anomaly score, insert into output stream CREATE OR REPLACE PUMP "OUTPUT_PUMP" AS INSERT INTO "DESTINATION_SQL_STREAM" SELECT STREAM * FROM "TEMP_STREAM" ORDER BY FLOOR("TEMP_STREAM".ROWTIME TO SECOND), ANOMALY_SCORE DESC;