📅  最后修改于: 2021-01-11 10:25:56             🧑  作者: Mango
TensorFlow运行时是一个跨平台的库。系统架构使这种规模的组合变得灵活。我们基本熟悉TensorFlow编程概念,例如计算图,操作和会话。
首先需要理解一些术语才能理解TensorFlow架构。这些术语是TensorFlow可服务,可服务流,TensorFlow模型,加载程序,源,管理器和核心。 TensorFlow体系结构中的术语及其功能如下所述。
TensorFlow体系结构适合于读取和修改核心TensorFlow代码。
这些是TensorFlow服务中未完成的主要单元。可服务对象是客户端用于执行计算的对象。
servable的大小是灵活的。单个可服务项可能包含任何内容,从查找表到接口模型元组中的唯一模型。 servable应该具有任何类型和接口,以实现灵活性和未来的改进,例如:
TensorFlow服务器可以在任何单个服务器实例的生存期内处理一个或多个版本的可服务对象。它为新的算法配置,权重和随时间推移加载的其他数据打开了大门。它们还可以一次收费多个版本。它们还允许同时加载多个版本的可维护文档,从而逐步支持推出和试验。
任何可服务版本的序列,按数字的递增版本排序。
服务代表一个或多个可服务项目中的模型。机器学习的模型包括一个或多个算法,并查找嵌入表。 servable也可以充当模型的一部分。例如,一个大型查询表可以作为许多实例使用。
装载机管理着服务对象的生命周期。加载程序API支持通用基础结构,该基础结构独立于所涉及的特定学习算法,数据或产品用例。
简单来说,源是找到并提供可服务的模块。每个引用一次提供零个或更多可服务流。对于每个可服务的流,源仅为每个可服务的提供一个加载程序实例。
每个源还提供零个或更多可服务流。对于每个可服务的流,源仅提供一个加载程序实例,并使其可供加载。
TensorFlow经理处理Servable的整个生命周期,包括:
Manager观察到源并跟踪所有版本。 Manager尝试解决原因,但是可以拒绝加载Aspired版本。
管理人员也可以推迟“卸载” 。例如,管理员可以根据确保始终加载至少一个版本的策略,等待卸载至较新版本完成加载为止。
例如, GetServableHandle(),供客户端访问已加载的可服务实例。
这管理着可食用物品的以下方面:
TensorFlow技术架构:
TensorFlow就是这样一种算法后端。例如,我们将实现一个新的加载器,以加载,提供访问和卸载机器学习模型的新型可服务实例。
将TensorFlow请求批处理到单个应用程序中可以显着降低执行推理的成本,尤其是在存在硬件加速器和GPU的情况下。 TensorFlow服务具有一个索赔批处理设备,该设备可批准客户将其特定于类型的假设进行批处理,而不是将请求快速批处理。并要求算法系统可以更有效地处理。