voltha/leader.py - voltha - Gitiles

 #
 # Copyright 2016 the original author or authors.
 #
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
 #
 #      http://www.apache.org/licenses/LICENSE-2.0
 #
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
 #

 import re
 from hash_ring import HashRing
 from structlog import get_logger
 from twisted.internet import reactor
 from twisted.internet.base import DelayedCall
 from twisted.internet.defer import inlineCallbacks, DeferredList

 from asleep import asleep


 class Leader(object):
     """
     A single instance of this object shall exist across the whole cluster.
     This is guaranteed by the coordinator which instantiates this class
     only when it secured the leadership lock, as well as calling the halt()
     method in cases it looses the leadership lock.
     """

     ID_EXTRACTOR = '^(%s)([^/]+)$'
     ASSIGNMENT_EXTRACTOR = '^%s(?P<member_id>[^/]+)/(?P<work_id>[^/]+)$'

     log = get_logger()

     # Public methods:

     def __init__(self, coordinator):

         self.coord = coordinator
         self.halted = False
         self.soak_time = 3  # soak till membership/workload changes settle

         self.workload = []
         self.members = []
         self.reassignment_soak_timer = None

         self.workload_id_match = re.compile(
              self.ID_EXTRACTOR % self.coord.WORKLOAD_PREFIX).match

         self.member_id_match = re.compile(
             self.ID_EXTRACTOR % self.coord.MEMBERSHIP_PREFIX).match

         self.assignment_match = re.compile(
             self.ASSIGNMENT_EXTRACTOR % self.coord.ASSIGNMENT_PREFIX).match

     @inlineCallbacks
     def start(self):
         self.log.info('leader-started')
         yield self._validate_workload()
         yield self._start_tracking_assignments()

     def halt(self):
         """Suspend leadership duties immediately"""
         self.log.info('leader-halted')
         self.halted = True

         # any active cancellations, releases, etc., should happen here
         if isinstance(self.reassignment_soak_timer, DelayedCall):
             if not self.reassignment_soak_timer.called:
                 self.reassignment_soak_timer.cancel()

     # Private methods:

     @inlineCallbacks
     def _validate_workload(self):
         """
         Workload is defined as any k/v entries under the workload prefix
         in consul. Under normal operation, only the leader shall edit the
         workload list. But we make sure that in case an administrator
         manually edits the workload, we react to that properly.
         """

         # TODO for now we simply generate a fixed number of fake entries
         yield DeferredList([
             self.coord.kv_put(
                 self.coord.WORKLOAD_PREFIX + 'device_group_%04d' % (i + 1),
                 'placeholder for device group %d data' % (i + 1))
             for i in xrange(100)
         ])

     def _start_tracking_assignments(self):
         """
         We must track both the cluster member list as well as the workload
         list. Upon change in either, we must rerun our sharding algorithm
         and reassign work as/if needed.
         """
         reactor.callLater(0, self._track_workload, 0)
         reactor.callLater(0, self._track_members, 0)

     @inlineCallbacks
     def _track_workload(self, index):

         try:
             (index, results) = yield self.coord.kv_get(
                 self.coord.WORKLOAD_PREFIX, index=index, recurse=True)

             matches = (self.workload_id_match(e['Key']) for e in results)
             workload = [m.group(2) for m in matches if m is not None]

             if workload != self.workload:
                 self.log.info('workload-changed',
                               old_workload_count=len(self.workload),
                               new_workload_count=len(workload))
                 self.workload = workload
                 self._restart_reassignment_soak_timer()

         except Exception, e:
             self.log.exception('workload-track-error', e=e)
             yield asleep(1.0)  # to prevent flood

         finally:
             if not self.halted:
                 reactor.callLater(0, self._track_workload, index)

     @inlineCallbacks
     def _track_members(self, index):

         try:
             (index, results) = yield self.coord.kv_get(
                 self.coord.MEMBERSHIP_PREFIX, index=index, recurse=True)

             matches = (self.member_id_match(e['Key']) for e in results or [])
             members = [m.group(2) for m in matches if m is not None]

             if members != self.members:
                 self.log.info('membership-changed',
                               old_members_count=len(self.members),
                               new_members_count=len(members))
                 self.members = members
                 self._restart_reassignment_soak_timer()

         except Exception, e:
             self.log.exception('members-track-error', e=e)
             yield asleep(1.0)  # to prevent flood

         finally:
             if not self.halted:
                 reactor.callLater(0, self._track_members, index)

     def _restart_reassignment_soak_timer(self):

         if self.reassignment_soak_timer is not None:
             assert isinstance(self.reassignment_soak_timer, DelayedCall)
             if not self.reassignment_soak_timer.called:
                 self.reassignment_soak_timer.cancel()

         self.reassignment_soak_timer = reactor.callLater(
             self.soak_time, self._reassign_work)

     @inlineCallbacks
     def _reassign_work(self):

         self.log.info('reassign-work')

         # Plan
         #
         # Step 1: calculate desired assignment from current members and
         #         workload list (e.g., using consistent hashing or any other
         #         algorithm
         # Step 2: collect current assignments from consul
         # Step 3: find the delta between the desired and actual assignments:
         #         these form two lists:
         #         1. new assignments to be made
         #         2. obsolete assignments to be revoked
         #         graceful handling may be desirable when moving existing
         #         assignment from existing member to another member (to make
         #         sure it is abandoned by old member before new takes charge)
         # Step 4: orchestrate the assignment by adding/deleting(/locking)
         #         entries in consul
         #
         # We must make sure while we are working on this, we do not re-enter
         # into same method!

         try:

             # Step 1: generate wanted assignment (mapping work to members)

             ring = HashRing(self.members)
             wanted_assignments = dict()  # member_id -> set(work_id)
             _ = [
                 wanted_assignments.setdefault(ring.get_node(work), set())
                 .add(work)
                 for work in self.workload
             ]
             for (member, work) in sorted(wanted_assignments.iteritems()):
                 self.log.info('assignment',
                               member=member, work_count=len(work))

             # Step 2: discover current assignment (from consul)

             (_, results) = yield self.coord.kv_get(
                 self.coord.ASSIGNMENT_PREFIX, recurse=True)

             matches = [
                 (self.assignment_match(e['Key']), e) for e in results or []]

             current_assignments = dict()  # member_id -> set(work_id)
             _ = [
                 current_assignments.setdefault(
                     m.groupdict()['member_id'], set())
                 .add(m.groupdict()['work_id'])
                 for m, e in matches if m is not None
             ]

             # Step 3: handle revoked assignments first on a per member basis

             for member_id, current_work in current_assignments.iteritems():
                 assert isinstance(current_work, set)
                 wanted_work = wanted_assignments.get(member_id, set())
                 work_to_revoke = current_work.difference(wanted_work)

                 # revoking work by simply deleting the assignment entry
                 # TODO if we want some feedback to see that member abandoned
                 # work, we could add a consul-based protocol here
                 for work_id in work_to_revoke:
                     yield self.coord.kv_delete(
                         self.coord.ASSIGNMENT_PREFIX
                         + member_id + '/' + work_id)

             # Step 4: assign new work as needed

             for member_id, wanted_work in wanted_assignments.iteritems():
                 assert isinstance(wanted_work, set)
                 current_work = current_assignments.get(member_id, set())
                 work_to_assign = wanted_work.difference(current_work)

                 for work_id in work_to_assign:
                     yield self.coord.kv_put(
                         self.coord.ASSIGNMENT_PREFIX
                         + member_id + '/' + work_id, '')

         except Exception, e:
             self.log.exception('failed-reassignment', e=e)
             self._restart_reassignment_soak_timer()  # try again in a while
	#
	# Copyright 2016 the original author or authors.
	#
	# Licensed under the Apache License, Version 2.0 (the "License");
	# you may not use this file except in compliance with the License.
	# You may obtain a copy of the License at
	#
	# http://www.apache.org/licenses/LICENSE-2.0
	#
	# Unless required by applicable law or agreed to in writing, software
	# distributed under the License is distributed on an "AS IS" BASIS,
	# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
	# See the License for the specific language governing permissions and
	# limitations under the License.
	#

	import re
	from hash_ring import HashRing
	from structlog import get_logger
	from twisted.internet import reactor
	from twisted.internet.base import DelayedCall
	from twisted.internet.defer import inlineCallbacks, DeferredList

	from asleep import asleep


	class Leader(object):
	"""
	A single instance of this object shall exist across the whole cluster.
	This is guaranteed by the coordinator which instantiates this class
	only when it secured the leadership lock, as well as calling the halt()
	method in cases it looses the leadership lock.
	"""

	ID_EXTRACTOR = '^(%s)([^/]+)$'
	ASSIGNMENT_EXTRACTOR = '^%s(?P<member_id>[^/]+)/(?P<work_id>[^/]+)$'

	log = get_logger()

	# Public methods:

	def __init__(self, coordinator):

	self.coord = coordinator
	self.halted = False
	self.soak_time = 3 # soak till membership/workload changes settle

	self.workload = []
	self.members = []
	self.reassignment_soak_timer = None

	self.workload_id_match = re.compile(
	self.ID_EXTRACTOR % self.coord.WORKLOAD_PREFIX).match

	self.member_id_match = re.compile(
	self.ID_EXTRACTOR % self.coord.MEMBERSHIP_PREFIX).match

	self.assignment_match = re.compile(
	self.ASSIGNMENT_EXTRACTOR % self.coord.ASSIGNMENT_PREFIX).match

	@inlineCallbacks
	def start(self):
	self.log.info('leader-started')
	yield self._validate_workload()
	yield self._start_tracking_assignments()

	def halt(self):
	"""Suspend leadership duties immediately"""
	self.log.info('leader-halted')
	self.halted = True

	# any active cancellations, releases, etc., should happen here
	if isinstance(self.reassignment_soak_timer, DelayedCall):
	if not self.reassignment_soak_timer.called:
	self.reassignment_soak_timer.cancel()

	# Private methods:

	@inlineCallbacks
	def _validate_workload(self):
	"""
	Workload is defined as any k/v entries under the workload prefix
	in consul. Under normal operation, only the leader shall edit the
	workload list. But we make sure that in case an administrator
	manually edits the workload, we react to that properly.
	"""

	# TODO for now we simply generate a fixed number of fake entries
	yield DeferredList([
	self.coord.kv_put(
	self.coord.WORKLOAD_PREFIX + 'device_group_%04d' % (i + 1),
	'placeholder for device group %d data' % (i + 1))
	for i in xrange(100)
	])

	def _start_tracking_assignments(self):
	"""
	We must track both the cluster member list as well as the workload
	list. Upon change in either, we must rerun our sharding algorithm
	and reassign work as/if needed.
	"""
	reactor.callLater(0, self._track_workload, 0)
	reactor.callLater(0, self._track_members, 0)

	@inlineCallbacks
	def _track_workload(self, index):

	try:
	(index, results) = yield self.coord.kv_get(
	self.coord.WORKLOAD_PREFIX, index=index, recurse=True)

	matches = (self.workload_id_match(e['Key']) for e in results)
	workload = [m.group(2) for m in matches if m is not None]

	if workload != self.workload:
	self.log.info('workload-changed',
	old_workload_count=len(self.workload),
	new_workload_count=len(workload))
	self.workload = workload
	self._restart_reassignment_soak_timer()

	except Exception, e:
	self.log.exception('workload-track-error', e=e)
	yield asleep(1.0) # to prevent flood

	finally:
	if not self.halted:
	reactor.callLater(0, self._track_workload, index)

	@inlineCallbacks
	def _track_members(self, index):

	try:
	(index, results) = yield self.coord.kv_get(
	self.coord.MEMBERSHIP_PREFIX, index=index, recurse=True)

	matches = (self.member_id_match(e['Key']) for e in results or [])
	members = [m.group(2) for m in matches if m is not None]

	if members != self.members:
	self.log.info('membership-changed',
	old_members_count=len(self.members),
	new_members_count=len(members))
	self.members = members
	self._restart_reassignment_soak_timer()

	except Exception, e:
	self.log.exception('members-track-error', e=e)
	yield asleep(1.0) # to prevent flood

	finally:
	if not self.halted:
	reactor.callLater(0, self._track_members, index)

	def _restart_reassignment_soak_timer(self):

	if self.reassignment_soak_timer is not None:
	assert isinstance(self.reassignment_soak_timer, DelayedCall)
	if not self.reassignment_soak_timer.called:
	self.reassignment_soak_timer.cancel()

	self.reassignment_soak_timer = reactor.callLater(
	self.soak_time, self._reassign_work)

	@inlineCallbacks
	def _reassign_work(self):

	self.log.info('reassign-work')

	# Plan
	#
	# Step 1: calculate desired assignment from current members and
	# workload list (e.g., using consistent hashing or any other
	# algorithm
	# Step 2: collect current assignments from consul
	# Step 3: find the delta between the desired and actual assignments:
	# these form two lists:
	# 1. new assignments to be made
	# 2. obsolete assignments to be revoked
	# graceful handling may be desirable when moving existing
	# assignment from existing member to another member (to make
	# sure it is abandoned by old member before new takes charge)
	# Step 4: orchestrate the assignment by adding/deleting(/locking)
	# entries in consul
	#
	# We must make sure while we are working on this, we do not re-enter
	# into same method!

	try:

	# Step 1: generate wanted assignment (mapping work to members)

	ring = HashRing(self.members)
	wanted_assignments = dict() # member_id -> set(work_id)
	_ = [
	wanted_assignments.setdefault(ring.get_node(work), set())
	.add(work)
	for work in self.workload
	]
	for (member, work) in sorted(wanted_assignments.iteritems()):
	self.log.info('assignment',
	member=member, work_count=len(work))

	# Step 2: discover current assignment (from consul)

	(_, results) = yield self.coord.kv_get(
	self.coord.ASSIGNMENT_PREFIX, recurse=True)

	matches = [
	(self.assignment_match(e['Key']), e) for e in results or []]

	current_assignments = dict() # member_id -> set(work_id)
	_ = [
	current_assignments.setdefault(
	m.groupdict()['member_id'], set())
	.add(m.groupdict()['work_id'])
	for m, e in matches if m is not None
	]

	# Step 3: handle revoked assignments first on a per member basis

	for member_id, current_work in current_assignments.iteritems():
	assert isinstance(current_work, set)
	wanted_work = wanted_assignments.get(member_id, set())
	work_to_revoke = current_work.difference(wanted_work)

	# revoking work by simply deleting the assignment entry
	# TODO if we want some feedback to see that member abandoned
	# work, we could add a consul-based protocol here
	for work_id in work_to_revoke:
	yield self.coord.kv_delete(
	self.coord.ASSIGNMENT_PREFIX
	+ member_id + '/' + work_id)

	# Step 4: assign new work as needed

	for member_id, wanted_work in wanted_assignments.iteritems():
	assert isinstance(wanted_work, set)
	current_work = current_assignments.get(member_id, set())
	work_to_assign = wanted_work.difference(current_work)

	for work_id in work_to_assign:
	yield self.coord.kv_put(
	self.coord.ASSIGNMENT_PREFIX
	+ member_id + '/' + work_id, '')

	except Exception, e:
	self.log.exception('failed-reassignment', e=e)
	self._restart_reassignment_soak_timer() # try again in a while