gcpdiag.queries.dataproc

Queries related to Dataproc.

class Region: View Source

134class Region:
135  """Represents Dataproc region"""
136
137  project_id: str
138  region: str
139
140  def __init__(self, project_id: str, region: str):
141    self.project_id = project_id
142    self.region = region
143
144  def get_clusters(self, context: models.Context) -> Iterable[Cluster]:
145    clusters = []
146    for cluster in self.query_api():
147      if not context.match_project_resource(resource=cluster.get('clusterName'),
148                                            labels=cluster.get('labels', {})):
149        continue
150      c = Cluster(
151          name=cluster['clusterName'],
152          project_id=self.project_id,
153          resource_data=cluster,
154      )
155      clusters.append(c)
156    return clusters
157
158  def query_api(self) -> Iterable[dict]:
159    api = apis.get_api('dataproc', 'v1', self.project_id)
160    query = (api.projects().regions().clusters().list(projectId=self.project_id,
161                                                      region=self.region))
162    # be careful not to retr too many times because querying all regions
163    # sometimes causes requests to fail permanently
164    resp = query.execute(num_retries=1)
165    return resp.get('clusters', [])

Represents Dataproc region

Region(project_id: str, region: str) View Source

140  def __init__(self, project_id: str, region: str):
141    self.project_id = project_id
142    self.region = region

project_id: str

region: str

def get_clusters( self, context: gcpdiag.models.Context) -> Iterable[Cluster]: View Source

144  def get_clusters(self, context: models.Context) -> Iterable[Cluster]:
145    clusters = []
146    for cluster in self.query_api():
147      if not context.match_project_resource(resource=cluster.get('clusterName'),
148                                            labels=cluster.get('labels', {})):
149        continue
150      c = Cluster(
151          name=cluster['clusterName'],
152          project_id=self.project_id,
153          resource_data=cluster,
154      )
155      clusters.append(c)
156    return clusters

def query_api(self) -> Iterable[dict]: View Source

158  def query_api(self) -> Iterable[dict]:
159    api = apis.get_api('dataproc', 'v1', self.project_id)
160    query = (api.projects().regions().clusters().list(projectId=self.project_id,
161                                                      region=self.region))
162    # be careful not to retr too many times because querying all regions
163    # sometimes causes requests to fail permanently
164    resp = query.execute(num_retries=1)
165    return resp.get('clusters', [])

class Dataproc: View Source

168class Dataproc:
169  """Represents Dataproc product"""
170
171  project_id: str
172
173  def __init__(self, project_id: str):
174    self.project_id = project_id
175
176  def get_regions(self) -> Iterable[Region]:
177    return [
178        Region(self.project_id, r.name)
179        for r in gce.get_all_regions(self.project_id)
180    ]
181
182  def is_api_enabled(self) -> bool:
183    return apis.is_enabled(self.project_id, 'dataproc')

Represents Dataproc product

Dataproc(project_id: str) View Source

173  def __init__(self, project_id: str):
174    self.project_id = project_id

project_id: str

def get_regions(self) -> Iterable[Region]: View Source

176  def get_regions(self) -> Iterable[Region]:
177    return [
178        Region(self.project_id, r.name)
179        for r in gce.get_all_regions(self.project_id)
180    ]

def is_api_enabled(self) -> bool: View Source

182  def is_api_enabled(self) -> bool:
183    return apis.is_enabled(self.project_id, 'dataproc')

@caching.cached_api_call

def get_clusters( context: gcpdiag.models.Context) -> Iterable[Cluster]: View Source

186@caching.cached_api_call
187def get_clusters(context: models.Context) -> Iterable[Cluster]:
188  r: List[Cluster] = []
189  dataproc = Dataproc(context.project_id)
190  if not dataproc.is_api_enabled():
191    return r
192  executor = get_executor()
193  for clusters in executor.map(lambda r: r.get_clusters(context),
194                               dataproc.get_regions()):
195    r += clusters
196  return r

built with pdoc logo

gcpdiag.queries.dataproc

Inherited Members