First version with ML prediction code
[ric-app/qp.git] / qp / insert.py
diff --git a/qp/insert.py b/qp/insert.py
new file mode 100644 (file)
index 0000000..ee87711
--- /dev/null
@@ -0,0 +1,79 @@
+# ==================================================================================
+#       Copyright (c) 2020 AT&T Intellectual Property.
+#       Copyright (c) 2020 HCL Technologies Limited.
+#
+#   Licensed under the Apache License, Version 2.0 (the "License");
+#   you may not use this file except in compliance with the License.
+#   You may obtain a copy of the License at
+#
+#          http://www.apache.org/licenses/LICENSE-2.0
+#
+#   Unless required by applicable law or agreed to in writing, software
+#   distributed under the License is distributed on an "AS IS" BASIS,
+#   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+#   See the License for the specific language governing permissions and
+#   limitations under the License.
+# ==================================================================================
+"""
+
+This module is temporary which aims to populate cell data into influxDB. This will be depreciated once KPIMON push cell info. into influxDB.
+
+"""
+import pandas as pd
+from influxdb import DataFrameClient
+import datetime
+
+
+class INSERTDATA:
+
+    def __init__(self):
+        host = 'r4-influxdb.ricplt'
+        self.client = DataFrameClient(host, '8086', 'root', 'root')
+        self.switchdb('UEData')
+        self.dropmeas('QP')
+
+    def switchdb(self, dbname):
+        print("Switch database: " + dbname)
+        self.client.switch_database(dbname)
+
+    def dropmeas(self, measname):
+        print("DROP MEASUREMENT: " + measname)
+        self.client.query('DROP MEASUREMENT '+measname)
+
+
+def explode(df):
+    for col in df.columns:
+        if isinstance(df.iloc[0][col], list):
+            df = df.explode(col)
+        d = df[col].apply(pd.Series)
+        df[d.columns] = d
+        df = df.drop(col, axis=1)
+    return df
+
+
+def jsonToTable(df):
+    df.index = range(len(df))
+    cols = [col for col in df.columns if isinstance(df.iloc[0][col], dict) or isinstance(df.iloc[0][col], list)]
+    if len(cols) == 0:
+        return df
+    for col in cols:
+        d = explode(pd.DataFrame(df[col], columns=[col]))
+        d = d.dropna(axis=1, how='all')
+        df = pd.concat([df, d], axis=1)
+        df = df.drop(col, axis=1).dropna()
+    return jsonToTable(df)
+
+
+def time(df):
+    df.index = pd.date_range(start=datetime.datetime.now(), freq='10ms', periods=len(df))
+    df['measTimeStampRf'] = df['measTimeStampRf'].apply(lambda x: str(x))
+    return df
+
+
+def populatedb():
+    df = pd.read_json('qp/cell.json.gz', lines=True)
+    df = df[['cellMeasReport']].dropna()
+    df = jsonToTable(df)
+    df = time(df)
+    db = INSERTDATA()
+    db.client.write_points(df, 'liveCell', batch_size=500, protocol='line')